مدل‌های هوش مصنوعی «گل» را مانند انسان درک نمی‌کنند

پژوهشگران دانشگاه اوهایو در تحقیقی جدید اعلام کردند مدل‌های زبانی پیشرفته مانند ChatGPT و Gemini توانایی درک معنایی، زیبایی‌شناسی و تداعی‌های احساسی واژه «گل» را به‌درستی ندارند.

به گزارش اقتصاد آنلاین به نقل از ایسنا، مدل‌های زبانی بزرگ(LLM) فقط بر اساس زبان و تصاویر آموزش می‌بینند و هیچ تجربه‌ای در توصیف فعالیت‌های حسی مانند لمس یا بویایی ندارند.

شیهوی ژو(Qihui Xu)، پژوهشگر اصلی این پژوهش می‌گوید: یک مدل زبانی بزرگ نمی‌تواند بوی گل رز، لمس گلبرگ‌های گل یا راه رفتن در مزرعه از میان گل‌های وحشی را درک کند. هوش مصنوعی بدون آن تجربیات حسی و حرکتی نمی‌تواند به معنای واقعی، یک گل با تمام غنای خود را نشان دهد. همین امر در مورد برخی دیگر از مفاهیم انسانی نیز صادق است.

ژو و همکارانش انسان‌ها و LLMها را از طریق پایگاه دانش مربوط به گل خود از 4442 کلمه مقایسه کردند. این شامل کلماتی مانند «گل»، «سُم»، «طنز» و «تاب» بود.

مقایسه بین انسان و دو مدل LLM از «چت‌جی‌پی‌تی» (GPT-3.5 و GPT-4) و هوش مدل‌های PaLM و Gemini گوگل انجام شد.

دو معیار برای آزمایش انسان و LLM مورد استفاده قرار گرفت. اولین مورد، هنجارهای گلاسکو نام داشت که برای کلمات بر اساس 9 بُعد مانند برانگیختگی، ملموس بودن و تصویرپذیری رتبه‌بندی می‌خواست.

محققان در اولین تحلیل بررسی کردند که انسان و هوش مصنوعی چگونه مفاهیم را به هم مرتبط می‌کنند. به عنوان مثال، آیا انسان‌ها و هوش مصنوعی موافق هستند که برخی از مفاهیم، برانگیختگی عاطفی بالاتری نسبت به دیگران دارند؟

در تجزیه و تحلیل دوم، محققان توانایی انسان‌ها و LLMها را برای تصمیم‌گیری در مورد چگونگی ارتباط کلمات با یکدیگر بررسی کردند.

به عنوان مثال، پاستا و گل رز هر دو بویی قوی دارند، بنابراین افراد ممکن است به آنها امتیاز بالایی بدهند از این منظر که چقدر حس بویایی ما را درگیر می‌کنند، اما با وجود اینکه هر دو بویی قوی دارند، ما پاستا را بیشتر شبیه نودل می‌دانیم تا گل رز. این به این دلیل است که ما چیزها را فقط بر اساس یک حس (مانند بویایی) مقایسه نمی کنیم، بلکه به ظاهر و طعم آنها نیز می‌اندیشیم.

بررسی نتایج

به طور کلی، LLMها با مفاهیم انسانی ارتباط بسیار خوبی داشتند، اما این تفاوت زمانی رخ داد که هوش مصنوعی مجبور بود چیزهایی را که به چیزهای حسی مانند طعم و مزه مرتبط هستند، توصیف کند. اینجاست که هوش مصنوعی نتوانست مفاهیم انسانی را به تصویر بکشد.

محققان می‌گویند: از عطر شدید یک گل و لمس ابریشمی گلبرگ‌ها تا شادی عمیقی که برانگیخته می‌شود، بازنمایی انسانی از «گل» این تجربیات و تعاملات متنوع را در یک مقوله منسجم پیوند می‌دهد.

ژو گفت: هوش‌های مصنوعی آنچه را که می‌دانند با مصرف مقادیر زیادی متن به دست می‌آورند و هنوز نمی‌توانند برخی از مفاهیم را به روشی که انسان‌ها انجام می‌دهند، به تصویر بکشند.

با این حال، ژو به سرعت متوجه شد که LLMها در حال بهبود مستمر هستند و به همین دلیل، آنها در طول زمان در کسب و توصیف احساسات انسانی بهتر خواهند شد. در آینده، زمانی که LLMها با داده‌های حسی و رباتیک ترکیب شوند، توانایی‌های استدلال خود را بهبود می‌بخشند و بر اساس آن در دنیای فیزیکی عمل می‌کنند.