در سکوت آبی اقیانوسها، گفتوگوهایی در جریان است که برای انسانها همچنان رمزآلود باقی ماندهاند؛ صداهایی که میان گروههای دلفین رد و بدل میشود، بیشتر شبیه موسیقی پیچیده طبیعت است تا زبان قابل درک. اما گوگل با معرفی مدل هوش مصنوعی DolphinGemma، گامی کمسابقه بهسوی رمزگشایی این الگوهای صوتی برداشته است؛ تلاشی که نهتنها درک ما از گونههای دریایی را دگرگون میکند، بلکه امکان بازتعریف مرزهای ارتباط میان انسان و جانوران را نیز فراهم میآورد.
این مقاله به بررسی این فناوری تازه و ظرفیتهای علمی آن بهعنوان یک مترجم هوش مصنوعی میپردازد.

زبان صوتی دلفینها: کلیکها، سوتها و پالسهای انفجاری
دلفینها از مجموعهای پیچیده و چندلایه از اصوات برای برقراری ارتباط استفاده میکنند. این صداها شامل سه گروه اصلی هستند: سوتها (Whistles)، کلیکها (Clicks) و صداهای پالسگونه انفجاری (Burst-Pulsed Sounds). هریک از این صداها نقش خاصی در تعاملات اجتماعی، شناسایی محیط و حفظ پیوندهای گروهی دارد.
۱. سوت (Whistles)؛ زبان اجتماعی دلفینها
سوتها صداهایی نرم، آهنگین و پیوسته هستند که دلفینها از آنها برای ارتباط اجتماعی استفاده میکنند.
در میان آنها، هر دلفین بینیبطری (bottlenose dolphin) یک صدای خاص و منحصربهفرد به نام «سوت امضایی» (Signature Whistle) دارد. این سوت درست مانند نام شخصی عمل میکند و دیگر دلفینها میتوانند با شنیدن آن، فرد مورد نظر را شناسایی یا صدا بزنند.
۲. کلیکها (Clicks)؛ چشم صوتی دلفینها
کلیکها صداهایی بسیار کوتاه، تیز و با فرکانس بالا هستند که دلفینها آنها را با سرعت بالا و بهصورت پشتسرهم تولید میکنند. این صداها مهمترین ابزار برای اکولاکیشن (Echolocation) یا «جهتیابی صوتی» هستند. دلفینها با ارسال کلیک به اطراف و گوشدادن به پژواک بازگشتی، میتوانند فاصله، اندازه، شکل و جنس اشیاء یا موجودات دیگر را شناسایی کنند.
جالب آنکه پژوهشها نشان میدهند کلیکها فقط برای ناوبری یا شکار نیستند؛ بلکه ممکن است اطلاعاتی درباره هویت فردی و وضعیت احساسی دلفین را هم منتقل کنند.
۳. پالسهای انفجاری (Burst-Pulsed Sounds)؛ پیامهای فوری و احساسی
پالسهای انفجاری مجموعهای از پالسهای فشرده و سریعاند که شبیه به صداهای لرزان یا تقتقمانند شنیده میشوند. این صداها در موقعیتهایی استفاده میشوند که دلفین نیاز به ارسال پیام فوری یا احساسی دارد (مثل ابراز هیجان، هشدار، رقابت، یا در تعاملات نزدیک اجتماعی).
بهدلیل سرعت بالای تولید و الگوهای پیچیده این صداها، هوش مصنوعی DolphinGemma هنوز بهطور کامل آنها را رمزگشایی نکرده، اما بهوضوح در تنظیم روابط اجتماعی و کنترل تنشها نقش مهمی دارند.
DolphinGemma؛ مغز دیجیتال گوگل برای فهم صدای دلفینها
هوش مصنوعی DolphinGemma یک نمونه پیشرفته از هوش مصنوعی است که توسط گوگل توسعه یافته و هدف اصلی آن تحلیل، درک و رمزگشایی صداهای دلفینهاست. DolphinGemma بر پایه خانوادهای از مدلهای زبان گوگل به نام Gemma ساخته شده است. این مدلها بهطور خاص برای درک توالیها طراحی شدهاند؛ یعنی توانایی تحلیل و پیشبینی مجموعهای از نشانهها که پشتسر هم قرار دارند، مثل کلمات در یک جمله یا صداها در یک پیام صوتی را دارند.
ورودی مدل: رمزگذاری صداهای دلفین
برای آنکه صداهای خام تولیدشده توسط دلفینها قابل پردازش شوند، ابتدا به کمک یک تکنولوژی گوگل به نام SoundStream به رشتههایی از داده (توکن) تبدیل میشوند. این توکنها مثل حروف یک کلمه یا نتهای یک آهنگ هستند که مدل میتواند آنها را تحلیل کند.
یادگیری الگوها و پیشبینی صدا
هوش مصنوعی DolphinGemma با بررسی حجم بزرگی از این توکنها، الگوهای ارتباطی میان آنها را یاد میگیرد. سپس میتواند پیشبینی کند که در ادامه یک «جمله صوتی دلفینی» چه صداهایی ممکن است تولید شود؛ دقیقاً مانند مدلهای زبان انسانی که کلمه بعدی را پیشبینی میکنند. این موضوع کلید اصلی در فهم ساختار احتمالی زبان دلفینهاست. هوش مصنوعی DolphinGemma حتی میتواند توالیهای صوتی بدیع و شبیه به دلفین تولید کند.
این مدل با دادههایی تغذیه شده که حاصل بیش از ۴۰ سال تحقیقات میدانی پروژه دلفینهای وحشی (WDP) در سواحل باهاما است.
ویژگی منحصربهفرد: اجرا روی موبایل
برخلاف بسیاری از مدلهای سنگین هوش مصنوعی، DolphinGemma آنقدر بهینهسازی شده که میتواند حتی روی گوشیهای موبایل مانند Google Pixel اجرا شود. این ویژگی باعث میشود محققان بتوانند از آن در محیطهای طبیعی اقیانوسی استفاده کنند و بهصورت بلادرنگ صداهای دلفینها را تحلیل کنند.

تحقق رویای بشر؛ ارتباط دوسویه با دلفینها
درحالیکه هوش مصنوعی DolphinGemma تمرکز اصلیاش بر درک ارتباط طبیعی میان دلفینهاست، یک پروژهی موازی هم وجود دارد که در حال بررسی امکان برقراری ارتباط فعال و دوسویه با این حیوانات است.
سامانهای به نام CHAT (مخفف افزایش شنوایی و تلهمتری دلفینها) که با همکاری پروژهی WDP و دانشگاه جورجیا تک توسعه یافته، بهجای تلاش برای ترجمه کامل زبان پیچیده دلفینها، بهدنبال ایجاد نوعی واژگان ساده و مشترک میان انسان و دلفین است.
در این روش، دانشمندان از صداهای سوتمانند مصنوعی و جدیدی استفاده میکنند که توسط CHAT تولید شدهاند و شبیه صداهای طبیعی دلفینها نیستند. این صداها با اشیایی که دلفینها به آن علاقه دارند—مثل روسری یا جلبک دریایی—مرتبط میشوند. محققان این ارتباط میان صدا و شیء را به دلفینها نشان میدهند و امیدوارند که دلفینها، از روی کنجکاوی، صدای خاص را تقلید کنند تا آن شیء را درخواست کنند.
شاید زمانی برسد که بتوان از طریق چت با هوش مصنوعی با دلفینها نیز مانند یک فرد خارجی ارتباط برقرار کرد.
خلاصه مقاله
گوگل مدل هوش مصنوعی DolphinGemma را برای رمزگشایی ارتباطات دلفینها معرفی کرد. این مدل پیچیده صداهای دلفینها را که شامل سوتها، کلیکها و پالسهای انفجاری است، تحلیل میکند. DolphinGemma با استفاده از دادههای بیش از 40 سال تحقیقات و تکنولوژیSoundStream، صداهای دلفینها را به توکنهای قابل پردازش تبدیل کرده و الگوهای ارتباطی آنها را میآموزد. این مدل حتی روی موبایلها قابل اجراست و امکان تحلیل بلادرنگ صداها در محیطهای طبیعی را فراهم میآورد. هدف بلندمدت این پروژه، برقراری ارتباط دوسویه با دلفینهاست. شاید زمانی برسد که بتوان با چت با هوش مصنوعی با دلفینها نیز مانند یک فرد خارجی ارتباط برقرار گرد.
Artificial Intelligence News
