Friday, May 10, 2024
হোমপ্রযুক্তিঅ্যাপভয়েস ক্লোনিং (Voice Cloning) বুঝবেন কীভাবে? পর্ব 2

ভয়েস ক্লোনিং (Voice Cloning) বুঝবেন কীভাবে? পর্ব 2

Voice Cloning: AI স্বর বা কৃত্রিম মেধাকে কাজে লাগিয়ে কেউ আপনার প্রিয়জনের গলার নকল করলে তা চেনার থেকেও আগে আপনাকে সতর্ক থাকতে হবে। যে কোনও ফোন কলের ক্ষেত্রেই সজাগ থাকুন। কোনও ফোন কল আসার আগে যে কয়েকটি বিষয় মাথায় রাখা খুব জরুরি...

প্রথমাংশের পর…

এই যে ফোনের ওপার থেকে টাকা চাওয়ার সময় করুণ গলা শুনতে পাওয়া যায়, তা কিন্তু সফটওয়্যারেই তৈরি। অর্থাৎ সেই নকল কণ্ঠস্বরে নানা ধরনের আবেগও ফুটিয়ে তুলতে পারে ভয়েস ক্লোনিং সফটওয়্যার।

যেমন রাগ, ভয়, আনন্দ, প্রেম, বিরহ বা বিরক্তি সব কিছুই ফুটে উঠবে কথা বলার সময়। ফলে যে কেউই ফাঁদে পড়তে পারেন এই প্রতারণার। TV9 বাংলা ডিজিটালের তরফে এ প্রসঙ্গে কথা বলা হয়েছে সাইবার বিশেষজ্ঞ সুশোভন মুখোপাধ্যায় (সহ-প্রতিষ্ঠাতা ও সিইও, প্রাইম ইনফোসার্ভ এলএলপি)-এর সঙ্গে। এই দ্বিতীয় ও সর্বশেষ পর্বেও থাকবে সুশোভনের পরামর্শ।

ভয়েস ক্লোনিং এই ব্যবসার রমরমা…

নকল কন্ঠস্বর তৈরির এই ব্যবসার এখন রমরমা যথেষ্ট। আমেরিকার বোস্টন শহরে এরকম একটি সংস্থাও রয়েছে। তার নাম ভোকালআইডি (VocalID)। ভোকালআইডি সংস্থাটি তৈরি করেছেন রুপল প্যাটেল।

তিনি আমেরিকার একজন ভয়েস ক্লোনিং বিশেষজ্ঞ। আর সেই সঙ্গে কোম্পানিটির প্রতিষ্ঠাতাও। রুপল প্যাটেল এই কোম্পানি গড়ে তোলেন 2014 সালে। এমন এক ধরনের বিষয় নিয়ে কাজ করার উদ্দেশ্য রূপলের তৈর হয় চিকিৎসাবিজ্ঞানকে আরও উন্নত করতে।

যেসব রোগী অসুস্থতার কারণে বা অস্ত্রোপচারের পর কথা বলার ক্ষমতা হারিয়েছেন, তারা যাতে যন্ত্রের সাহায্যে কৃত্রিমভাবে তৈরি ‘আসল’ কণ্ঠস্বরে কথা বলতে পারেন, তা নিশ্চিত করাই ছিল রূপলের স্বপ্ন।

আর তার জন্য ভয়েস ক্লোনিং প্রযুক্তির ওপর ভিত্তি করে তিনি প্রতিষ্ঠা করেন ভোকালআইডি। আজ 2024 সালে আপনি বিভিন্ন জালিয়াতির ঘটনার পিছনে যেখানে ভয়েস ক্লোনিং-এর ব্যবহারের কথা শুনছেন, তখন একবারের জন্য ভেবে দেখুন: ১০ বছর, মানে এক দশক আগে তা নিয়ে ব্যবসা শুরু হয়েছিল মার্কিন মুলুকে।

কিন্তু এখন ভয়েস ক্লোনিং যে বিপদ ডেকে আনতে পারে, ১০ বছর আগে তেমনটা সেভাবে কেউ হয়তো ভেবে উঠতে পারেননি।

ভয়েস ক্লোনিং-এর বিপদ কোথায়?

এই উচ্চ প্রযুক্তি সম্পন্ন ভয়েস ক্লোনিং-এর বাণিজ্যিক সুবিধা যেমন আছে, তেমনই এর ভয়াবহ ঝুঁকির দিকগুলিও ভুলে গেলে চলবে না। বর্তমানে বিশেষজ্ঞরা এই প্রযুক্তির অনিয়ন্ত্রিত ব্যবহার নিয়ে খুবই উদ্বিগ্ন।

সাইবার ক্রাইমের জন্য এই প্রযুক্তি খুবই ঊর্বর এক ক্ষেত্র। কারণ ভয়েস ক্লোনিং ব্যবহার করে যিনি আপনার সঙ্গে কথা বলছেন, তিনি আসল মানুষ নাকি নকল মানুষ, তা বোঝা অসম্ভব হয়ে দাঁড়াচ্ছে। ফলে মানুষকে ফাঁদে ফেলা অপরাধীদের জন্য খুবই সহজ হয়ে উঠছে।

কিন্তু ভয়েস চিনবেন কীভাবে?

AI স্বর বা কৃত্রিম মেধাকে কাজে লাগিয়ে কেউ আপনার প্রিয়জনের গলার নকল করলে তা চেনার থেকেও আগে আপনাকে সতর্ক থাকতে হবে। যে কোনও ফোন কলের ক্ষেত্রেই সজাগ থাকুন। কোনও ফোন কল আসার আগে যে কয়েকটি বিষয় মাথায় রাখা খুব জরুরি…

1) অপ্রত্যাশিত বা অজানা নম্বর থেকে কল এলে সর্বদা সতর্ক থাকুন। পরিচয় যাচাই করে নিন খুব ভাল করে।

2) ফোনে কে, কী বলছেন, গলাটা রোবটের মতো শোনাচ্ছে কি না, উচ্চারণে ভুলচুক কতটা রয়েছে, এই বিষয়গুলি নজরে রাখুন।

3) যিনি ফোন করছেন, তিনি যদি টাকা চেয়ে বসেন, তাহলে তা দেওয়ার আগে কয়েকবার ভাবুন। প্রয়োজন হলে তার ফোনটি কেটে আপনি ওই ব্যক্তির সেভ-করা নম্বর কনট্যাক্ট লিস্ট থেকে বের করে তাতে নিজে একবার কল করে নিন। যাচাই করতে দোষ কোথায়?

4) অনলাইনে কখনও, কোথাও আপনার অডিও ক্লিপ আপলোড করবেন না। নাহলে নিজের বিপদ নিজেই ডেকে আনবেন। অর্থাৎ হোয়াটসঅ্যাপের মতো জনপ্রিয় প্ল্যাটফর্মেও আগামিদিনে অডিও মেসেজ পাঠাবেন কি না, তা ভেবে দেখুন।

ভয়েস ক্লোনিংয়ের ভরসায় পাকিস্তানের প্রাক্তন প্রধানমন্ত্রী…

পাকিস্তানের প্রাক্তন প্রধানমন্ত্রী ইমরান খান এখনও জেলেই রয়েছেন। কিন্তু তিনি জেলে থাকাকালীনই ভোটের আগে তাঁর একের পর এক বক্তৃতা শোনা গিয়েছে পাকিস্তানে। আর তার সবটাই করা হয়েছে ভয়েস ক্লোনিংয়ের মাধ্যমে।

2023-এর ডিসেম্বরের মাঝামাঝি সময়েই প্রথম ইমরান খানের কণ্ঠস্বর নকল করা হয়। সেই সময় প্রাক্তন প্রধানমন্ত্রী ইমরান খান জেলে থাকাকালীনই স্ক্রিপ্ট পাঠিয়েছিলেন তার রাজনৈতিক দলকে।

আর সেই স্ক্রিপ্টই তারা ভয়েস ক্লোনিং সফটওয়্যারে ব্যবহার করেছিল। তারপর তা প্রচার করা হয়েছিল গোটা দেশে অর্থাৎ সেই প্রচারে ইমরান খানের যে কন্ঠ শোনা যাচ্ছিল, তা আসলে ক্লোনড ভয়েস (cloned voice)।


সাইবার বিশেষজ্ঞ সুশোভন মুখোপাধ্যায় (সহ-প্রতিষ্ঠাতা ও সিইও, প্রাইম ইনফোসার্ভ এলএলপি)-এর সঙ্গে কথোপকথনের পরবর্তী ও শেষ অংশ:

প্রশ্ন: AI Vocal-এর মাধ্যমে ভয়েস ক্লোনিং কী-কী বিপদ ডেকে আনবে?

সুশোভন: এখন AI-এর মাধ্যমে যে ভয়েস ক্লোনিংয়ের যে প্রবণতা সর্বত্র, তাতে বিরাট প্রভাব পড়তে পারে বিভিন্ন শিল্পক্ষেত্রে। বিশেষত যাঁরা ভয়েস ওভার শিল্পী (voice over artist), বাচিক শিল্পী বা নিউজ অ্যাঙ্কর, তাঁদের ক্ষেত্রে সমস্যা তৈরি হওয়ার আশঙ্কা রয়েছে।

ইতিমধ্যেই AI নিউজ অ্যাঙ্করকে খবর পরিবেশন করতে দেখাও গিয়েছে। অনেকেই আমরা মজার ছলে অনেক কিছু করছি। কিন্তু এর ফলেই অনেকে কাজ হারাতে পারেন, তা ভেবেই দেখছি না। অর্থাৎ যারা ভয়েস, ভিডিয়ো নিয়ে কাজ করেন, তাদের কাজ হারানোর ঝুঁকি অনেক বেশি।

আসলে সুবিধাটা কোথায় বলুন তো? AI-কে ব্যবহার করে যদি কাজ হাসিল হয়ে যায়, তাহলে অনেক কম খরচেই সব কাজ করিয়ে নিতে পারবে সংস্থাগুলো। ফলে AI-কে ব্যবহার করার প্রবণতা দিনের পর দিন বাড়বে, কমবে না মোটেই।

আপনারা হয়তো সোফিয়া (Sofia)-র কথা অনেকেই জানেন। সোফিয়া রোবট। সে যেমন সমস্ত কথার জবাব দেয়, তেমনই সমস্ত আবেগ, অনুভুতিও প্রকাশ করতে পারে। সে রেগে যায়, হাসে, ফ্যালফ্যাল করে তাকিয়ে থাকতে পারে।

আর এ সব কিছুই নিয়ন্ত্রণ করা হয় AI-এর মাধ্যমে। সে সব কিছু পারলেও তার অনুভব করার ক্ষমতা নেই। তার মানে যতই AI দিয়ে বিভিন্ন ধরনের ভয়েস, ভিডিয়ো তৈরি হোক না কেন, এ সবের মধ্য়ে কিন্তু কোনওভাবেই অনুভুতি আনা সম্ভব নয়।

ঠিক যেমন একটু আগে বললাম, হেমন্তবাবুর গলায় আধুনিক গান শুনতে বেশ মজা লাগলেও তার জন্য যে কণ্ঠিদের গুরুত্ব কমে যাবে, তা কিন্তু আমার এখনও মনে হয় না। কারণ একটা সময়ের পর AI-এর এই রমরমায় মানুষ নিজেই বিরক্ত হয়ে আসল কন্ঠস্বর খোঁজার চেষ্টা করবে।

ফলে শুরুর দিকে হয়তো অনেক মানুষ কাজ হারাতে পারেন। কিন্তু যারা মৌলিক শিল্পী, তাদের জায়গা সহজে AI নিতে পারবে না বলেই আমার মনে হয়।


প্রশ্ন: হোয়াটসঅ্যাপের মতো জনপ্রিয় প্ল্যাটফর্মেও আগামিদিনে অডিয়ো মেসেজ পাঠাতে গেলে সতর্ক হতে হবে কি?

সুশোভন: শুধু হোয়াটসঅ্যাপের মতো প্ল্যাটফর্ম বলে নয়, যে কোনও ক্ষেত্রেই নিজের কোনও ভয়েস, ভিডিয়ো বা কোনও তথ্য, ছবি অনালাইনে শেয়ার করার আগে আমাদের সতর্ক থাকা উচিত।

এই যে কখনও আমার রাগ হচ্ছে, কখনও আবার আনন্দ হচ্ছে, দুঃখ হচ্ছে, মানসিক সমস্যা হচ্ছে, কোথায় ঘুরতে যাচ্ছি, কোথায় খেতে যাচ্ছি, সব কিছু নিয়েই রিল বানিয়ে পোস্ট করে চলেছি।

আমি এমন কিছু মানুষকে দেখেছি, যারা সকালে উঠে বাজার করতে যাওয়া থেকে বন্ধুর বাড়ির নিমন্ত্রণে যাওয়া, সব কিছু পোস্ট করে দেয় সোশ্যাল মিডিয়ায়। তার প্রথম কাজই হচ্ছে পোস্ট করা।

মানে পোস্ট করার মধ্যে তারা অদ্ভুত এক আনন্দ খুঁজে পান। তবে এমনটা কিন্তু ঠিক কাজ নয়। যত পরিমাণে ভয়েস, ভিডিয়ো আপনি ইন্টারনেটে ছাড়ছেন, ততই কিন্তু বিভিন্ন ডিজিটাল নমুনা (digital sample) আপনি অনলাইনে বিভিন্ন জায়গায় ছড়িয়ে দিচ্ছেন।

যার ফলে যারা হ্যাকার বা স্ক্যামার, তাদের কাজটা আরও সহজ হয়ে যাচ্ছে। এবার এ কথাও সত্যি যে, যারা খুব কম ভিডিয়ো, ছবি, ভয়েস অনলাইনে শেয়ার করেন, তারাও শিকার হচ্ছেন এই স্ক্যামের।

তাই একটা জিনিস মাথায় রাখতে হবে, শুধুই ভিডিয়ো বা অডিয়ো নয়, যে কোনও ছবি বা তথ্ইয অনলাইনে যতটা সম্ভব কম পোস্ট করা যায়, ততটাই আপনার জন্য ভাল।


এই খবরটিও পড়ুন

সৌজন্যেটিভি ৯বাংলা
প্রকাশনায়টিভি ৯বাংলা
রাসেল আকন্দ
রাসেল আকন্দhttps://grambangla.net
যদিও আমরা অনেক পিছিয়ে আছি পশ্চিমা সভ্যতার থেকে। তবে থেমে থাকছি না।
সম্পর্কিত আরো কিছু খবর

একটা কিছু লিখে জান

আপনার মতামত টি লিখুন!
এখানে আপনার নাম লিখুন

- Advertisment -

সর্বশেষ সংবাদ

আপনার জন্য

error: Content is protected !!

Discover more from গ্রাম বাংলা

Subscribe now to keep reading and get access to the full archive.

Continue reading