گوگل از مدل هوش مصنوعی DolphinGemma برای رمزگشایی ارتباطات دلفین‌ها رونمایی کرد

در سکوت آبی اقیانوس‌ها، گفت‌وگوهایی در جریان است که برای انسان‌ها همچنان رمزآلود باقی مانده‌اند؛ صداهایی که میان گروه‌های دلفین رد و بدل می‌شود، بیشتر شبیه موسیقی پیچیده‌ طبیعت‌ است تا زبان قابل درک. اما گوگل با معرفی مدل هوش مصنوعی DolphinGemma، گامی کم‌سابقه به‌سوی رمزگشایی این الگوهای صوتی برداشته است؛ تلاشی که نه‌تنها درک ما از گونه‌های دریایی را دگرگون می‌کند، بلکه امکان بازتعریف مرزهای ارتباط میان انسان و جانوران را نیز فراهم می‌آورد. 

این مقاله به بررسی این فناوری تازه و ظرفیت‌های علمی آن به‌عنوان یک مترجم هوش مصنوعی می‌پردازد. 

زبان صوتی دلفین‌ها: کلیک‌ها، سوت‌ها و پالس‌های انفجاری

زبان صوتی دلفین‌ها: کلیک‌ها، سوت‌ها و پالس‌های انفجاری

دلفین‌ها از مجموعه‌ای پیچیده و چندلایه از اصوات برای برقراری ارتباط استفاده می‌کنند. این صداها شامل سه گروه اصلی هستند: سوت‌ها (Whistles)، کلیک‌ها (Clicks) و صداهای پالس‌گونه انفجاری (Burst-Pulsed Sounds). هریک از این صداها نقش خاصی در تعاملات اجتماعی، شناسایی محیط و حفظ پیوندهای گروهی دارد.

۱. سوت‌ (Whistles)؛ زبان اجتماعی دلفین‌ها

سوت‌ها صداهایی نرم، آهنگین و پیوسته هستند که دلفین‌ها از آن‌ها برای ارتباط اجتماعی استفاده می‌کنند.

در میان آن‌ها، هر دلفین بینی‌بطری (bottlenose dolphin) یک صدای خاص و منحصر‌به‌فرد به نام «سوت امضایی» (Signature Whistle) دارد. این سوت درست مانند نام شخصی عمل می‌کند و دیگر دلفین‌ها می‌توانند با شنیدن آن، فرد مورد نظر را شناسایی یا صدا بزنند.

۲. کلیک‌ها (Clicks)؛ چشم صوتی دلفین‌ها

کلیک‌ها صداهایی بسیار کوتاه، تیز و با فرکانس بالا هستند که دلفین‌ها آن‌ها را با سرعت بالا و به‌صورت پشت‌سر‌هم تولید می‌کنند. این صداها مهم‌ترین ابزار برای اکولاکیشن (Echolocation) یا «جهت‌یابی صوتی» هستند. دلفین‌ها با ارسال کلیک به اطراف و گوش‌دادن به پژواک بازگشتی، می‌توانند فاصله، اندازه، شکل و جنس اشیاء یا موجودات دیگر را شناسایی کنند.

جالب آنکه پژوهش‌ها نشان می‌دهند کلیک‌ها فقط برای ناوبری یا شکار نیستند؛ بلکه ممکن است اطلاعاتی درباره‌ هویت فردی و وضعیت احساسی دلفین را هم منتقل کنند.

۳. پالس‌های انفجاری (Burst-Pulsed Sounds)؛ پیام‌های فوری و احساسی

پالس‌های انفجاری مجموعه‌ای از پالس‌های فشرده و سریع‌اند که شبیه به صداهای لرزان یا تق‌تق‌مانند شنیده می‌شوند. این صداها در موقعیت‌هایی استفاده می‌شوند که دلفین نیاز به ارسال پیام فوری یا احساسی دارد (مثل ابراز هیجان، هشدار، رقابت، یا در تعاملات نزدیک اجتماعی).

به‌دلیل سرعت بالای تولید و الگوهای پیچیده‌ این صداها، هوش مصنوعی DolphinGemma هنوز به‌طور کامل آن‌ها را رمزگشایی نکرده، اما به‌وضوح در تنظیم روابط اجتماعی و کنترل تنش‌ها نقش مهمی دارند.

DolphinGemma؛ مغز دیجیتال گوگل برای فهم صدای دلفین‌ها

هوش مصنوعی DolphinGemma یک نمونه پیشرفته از هوش مصنوعی است که توسط گوگل توسعه یافته و هدف اصلی آن تحلیل، درک و رمزگشایی صداهای دلفین‌هاست. DolphinGemma بر پایه‌ خانواده‌ای از مدل‌های زبان گوگل به نام Gemma ساخته شده است. این مدل‌ها به‌طور خاص برای درک توالی‌ها طراحی شده‌اند؛ یعنی توانایی تحلیل و پیش‌بینی مجموعه‌ای از نشانه‌ها که پشت‌سر هم قرار دارند، مثل کلمات در یک جمله یا صداها در یک پیام صوتی را دارند.

ورودی مدل: رمزگذاری صداهای دلفین

برای آنکه صداهای خام تولیدشده توسط دلفین‌ها قابل پردازش شوند، ابتدا به کمک یک تکنولوژی گوگل به نام SoundStream به رشته‌هایی از داده (توکن) تبدیل می‌شوند. این توکن‌ها مثل حروف یک کلمه یا نت‌های یک آهنگ هستند که مدل می‌تواند آن‌ها را تحلیل کند.

یادگیری الگوها و پیش‌بینی صدا

هوش مصنوعی DolphinGemma با بررسی حجم بزرگی از این توکن‌ها، الگوهای ارتباطی میان آن‌ها را یاد می‌گیرد. سپس می‌تواند پیش‌بینی کند که در ادامه یک «جمله صوتی دلفینی» چه صداهایی ممکن است تولید شود؛ دقیقاً مانند مدل‌های زبان انسانی که کلمه بعدی را پیش‌بینی می‌کنند. این موضوع کلید اصلی در فهم ساختار احتمالی زبان دلفین‌هاست. هوش مصنوعی DolphinGemma حتی می‌تواند توالی‌های صوتی بدیع و شبیه به دلفین تولید کند.

این مدل با داده‌هایی تغذیه شده که حاصل بیش از ۴۰ سال تحقیقات میدانی پروژه دلفین‌های وحشی (WDP) در سواحل باهاما است. 

ویژگی منحصربه‌فرد: اجرا روی موبایل

برخلاف بسیاری از مدل‌های سنگین هوش مصنوعی، DolphinGemma آن‌قدر بهینه‌سازی شده که می‌تواند حتی روی گوشی‌های موبایل مانند Google Pixel اجرا شود. این ویژگی باعث می‌شود محققان بتوانند از آن در محیط‌های طبیعی اقیانوسی استفاده کنند و به‌صورت بلادرنگ صداهای دلفین‌ها را تحلیل کنند.

تحقق رویای بشر؛ ارتباط دوسویه با دلفین‌ها

تحقق رویای بشر؛ ارتباط دوسویه با دلفین‌ها

درحالی‌که هوش مصنوعی DolphinGemma تمرکز اصلی‌اش بر درک ارتباط طبیعی میان دلفین‌هاست، یک پروژه‌ی موازی هم وجود دارد که در حال بررسی امکان برقراری ارتباط فعال و دوسویه با این حیوانات است.

سامانه‌ای به نام CHAT (مخفف افزایش شنوایی و تله‌متری دلفین‌ها) که با همکاری پروژه‌ی WDP و دانشگاه جورجیا تک توسعه یافته، به‌جای تلاش برای ترجمه‌ کامل زبان پیچیده‌ دلفین‌ها، به‌دنبال ایجاد نوعی واژگان ساده و مشترک میان انسان و دلفین است.

در این روش، دانشمندان از صداهای سوت‌مانند مصنوعی و جدیدی استفاده می‌کنند که توسط CHAT تولید شده‌اند و شبیه صداهای طبیعی دلفین‌ها نیستند. این صداها با اشیایی که دلفین‌ها به آن علاقه دارند—مثل روسری یا جلبک دریایی—مرتبط می‌شوند. محققان این ارتباط میان صدا و شیء را به دلفین‌ها نشان می‌دهند و امیدوارند که دلفین‌ها، از روی کنجکاوی، صدای خاص را تقلید کنند تا آن شیء را درخواست کنند.

شاید زمانی برسد که بتوان از طریق چت با هوش مصنوعی با دلفین‌ها نیز مانند یک فرد خارجی ارتباط برقرار کرد.

خلاصه مقاله

گوگل مدل هوش مصنوعی DolphinGemma را برای رمزگشایی ارتباطات دلفین‌ها معرفی کرد. این مدل پیچیده صداهای دلفین‌ها را که شامل سوت‌ها، کلیک‌ها و پالس‌های انفجاری است، تحلیل می‌کند. DolphinGemma با استفاده از داده‌های بیش از 40 سال تحقیقات و تکنولوژیSoundStream، صداهای دلفین‌ها را به توکن‌های قابل پردازش تبدیل کرده و الگوهای ارتباطی آن‌ها را می‌آموزد. این مدل حتی روی موبایل‌ها قابل اجراست و امکان تحلیل بلادرنگ صداها در محیط‌های طبیعی را فراهم می‌آورد. هدف بلندمدت این پروژه، برقراری ارتباط دوسویه با دلفین‌هاست. شاید زمانی برسد که بتوان با چت با هوش مصنوعی با دلفین‌ها نیز مانند یک فرد خارجی ارتباط برقرار گرد. 
Artificial Intelligence News

به بالا بروید