مدلهای هوش مصنوعی «گل» را مانند انسان درک نمیکنند

به گزارش اقتصاد آنلاین به نقل از ایسنا، مدلهای زبانی بزرگ(LLM) فقط بر اساس زبان و تصاویر آموزش میبینند و هیچ تجربهای در توصیف فعالیتهای حسی مانند لمس یا بویایی ندارند.
شیهوی ژو(Qihui Xu)، پژوهشگر اصلی این پژوهش میگوید: یک مدل زبانی بزرگ نمیتواند بوی گل رز، لمس گلبرگهای گل یا راه رفتن در مزرعه از میان گلهای وحشی را درک کند. هوش مصنوعی بدون آن تجربیات حسی و حرکتی نمیتواند به معنای واقعی، یک گل با تمام غنای خود را نشان دهد. همین امر در مورد برخی دیگر از مفاهیم انسانی نیز صادق است.
ژو و همکارانش انسانها و LLMها را از طریق پایگاه دانش مربوط به گل خود از 4442 کلمه مقایسه کردند. این شامل کلماتی مانند «گل»، «سُم»، «طنز» و «تاب» بود.
مقایسه بین انسان و دو مدل LLM از «چتجیپیتی» (GPT-3.5 و GPT-4) و هوش مدلهای PaLM و Gemini گوگل انجام شد.
دو معیار برای آزمایش انسان و LLM مورد استفاده قرار گرفت. اولین مورد، هنجارهای گلاسکو نام داشت که برای کلمات بر اساس 9 بُعد مانند برانگیختگی، ملموس بودن و تصویرپذیری رتبهبندی میخواست.
محققان در اولین تحلیل بررسی کردند که انسان و هوش مصنوعی چگونه مفاهیم را به هم مرتبط میکنند. به عنوان مثال، آیا انسانها و هوش مصنوعی موافق هستند که برخی از مفاهیم، برانگیختگی عاطفی بالاتری نسبت به دیگران دارند؟
در تجزیه و تحلیل دوم، محققان توانایی انسانها و LLMها را برای تصمیمگیری در مورد چگونگی ارتباط کلمات با یکدیگر بررسی کردند.
به عنوان مثال، پاستا و گل رز هر دو بویی قوی دارند، بنابراین افراد ممکن است به آنها امتیاز بالایی بدهند از این منظر که چقدر حس بویایی ما را درگیر میکنند، اما با وجود اینکه هر دو بویی قوی دارند، ما پاستا را بیشتر شبیه نودل میدانیم تا گل رز. این به این دلیل است که ما چیزها را فقط بر اساس یک حس (مانند بویایی) مقایسه نمی کنیم، بلکه به ظاهر و طعم آنها نیز میاندیشیم.
بررسی نتایج
به طور کلی، LLMها با مفاهیم انسانی ارتباط بسیار خوبی داشتند، اما این تفاوت زمانی رخ داد که هوش مصنوعی مجبور بود چیزهایی را که به چیزهای حسی مانند طعم و مزه مرتبط هستند، توصیف کند. اینجاست که هوش مصنوعی نتوانست مفاهیم انسانی را به تصویر بکشد.
محققان میگویند: از عطر شدید یک گل و لمس ابریشمی گلبرگها تا شادی عمیقی که برانگیخته میشود، بازنمایی انسانی از «گل» این تجربیات و تعاملات متنوع را در یک مقوله منسجم پیوند میدهد.
ژو گفت: هوشهای مصنوعی آنچه را که میدانند با مصرف مقادیر زیادی متن به دست میآورند و هنوز نمیتوانند برخی از مفاهیم را به روشی که انسانها انجام میدهند، به تصویر بکشند.
با این حال، ژو به سرعت متوجه شد که LLMها در حال بهبود مستمر هستند و به همین دلیل، آنها در طول زمان در کسب و توصیف احساسات انسانی بهتر خواهند شد. در آینده، زمانی که LLMها با دادههای حسی و رباتیک ترکیب شوند، تواناییهای استدلال خود را بهبود میبخشند و بر اساس آن در دنیای فیزیکی عمل میکنند.