سیستمی برای ارزیابی و رتبه‌بندی مدل‌های زبانی (LLM) فارسی راه‌اندازی شد

سیستمی برای ارزیابی و رتبه‌بندی مدل‌های زبانی (LLM) فارسی راه‌اندازی شد

سیستم جامع ارزیابی مدل‌های زبانی فارسی برای رتبه‌بندی LLM-های فارسی راه‌اندازی شد.

آزمایشگاه پردازش زبان طبیعی دانشگاه صنعتی امیرکبیر و مرکز تحقیقات هوش مصنوعی پارت، برای ارزیابی مدل‌های زبانی (LLM) فارسی، سیستم جدیدی رونمایی کردند. این سیستم شامل جدول رتبه‌بندی و ابزارهای ارزیابی پیشرفته‌ای است که عملکرد مدل‌های مختلف در حوزه‌هایی مانند درک متن و پاسخ‌دهی را مقایسه می‌کند.

توسعه‌دهندگان Open Persian LLM Leaderboard با اشاره به اینکه سیستم‌های ارزیابی پیشین، مدل‌های زبانی فارسی را صرفا با سطح دانش دبیرستان محک می‌زدند، ادعا می‌کنند که سیستم جدید قابلیت ارزیابی مدل‌ها در سطح کارشناسی ارشد و عرصه‌های گوناگون از جمله پزشکی، اقتصاد، صنعت، منطق و مهندسی را ارائه می‌دهد. به‌گفته‌ی توسعه‌دهندگان، این چهارچوب ارزیابی با بیش‌از ۴۰هزار نمونه توسعه داده شده و تعداد نمونه‌ها به‌طور مستمر در حال افزایش است.

قرار است سیستم جامع ارزیابی مدل‌های زبانی فارسی به توسعه‌دهندگان کمک کند تا مدل‌های خود را براساس معیارهای استاندارد ارزیابی کنند و کیفیت آن‌ها را بهبود دهند. ظاهرا بخشی از قابلیت‌های سیستم ارزیابی جدید به‌صورت متن‌باز در وب‌سایت HuggingFace هم قرار گرفته است تا دسترسی پژوهشگران و توسعه‌دهندگان به این سیستم ساده‌تر باشد.

برچسب

⚠ گزارش اشکال

5 ماه پیش

منبع خبر

مطالب مرتبط

جدیدترین ویدئوها

مدیر سابق شبکه سه: اشتباه فردوسی‌پور در سیاسی کردن برنامه 90 بود؛ شب ولادت حضرت زهرا(س) مشکی پوشیده بود چون...+ویدیو

play

مدیر سابق شبکه سه: اشتباه فردوسی‌پور در سیاسی کردن برنامه 90 بود؛ شب ولادت حضرت زهرا(س) مشکی پوشیده بود چون...+ویدیو

تذکر اکید رهبری درباره ایمنی کارگران در جمع هزاران کارگر + ویدئو

play

تذکر اکید رهبری درباره ایمنی کارگران در جمع هزاران کارگر + ویدئو

گرامیداشت یاد و خاطره شهید رئیسی توسط رهبر انقلاب در دیدار امروز کارگران | ویدئو

play

گرامیداشت یاد و خاطره شهید رئیسی توسط رهبر انقلاب در دیدار امروز کارگران | ویدئو

ترفند ساده برای ساخت شوینده خانگی با نوشابه و مایع ظرفشویی

play

ترفند ساده برای ساخت شوینده خانگی با نوشابه و مایع ظرفشویی

یک باگ عجیب در خلقت انسان‌ها!

play

یک باگ عجیب در خلقت انسان‌ها!

متلک سیاسی و خنده‌دار مهران مدیری: بابک زنجانی و محمود خاوری پای ثابت مهمونیهای ما بودند؛ "ب ز" جوری شاباش میداد که...+ویدیو

play

متلک سیاسی و خنده‌دار مهران مدیری: بابک زنجانی و محمود خاوری پای ثابت مهمونیهای ما بودند؛ "ب ز" جوری شاباش میداد که...+ویدیو

مستانه مهاجر همسر سابق پژمان بازغی: اصلا شبیه آدم هایی نیستیم که طلاق بگیریم و نخواهیم ریخت هم را ببینیم، اتفاقا الان بیشتر همدیگر را میبینیم! طلاق هم میگیرید این شکلی حرمت همو نگه دارید

play

مستانه مهاجر همسر سابق پژمان بازغی: اصلا شبیه آدم هایی نیستیم که طلاق بگیریم و نخواهیم ریخت هم را ببینیم، اتفاقا الان بیشتر همدیگر را میبینیم! طلاق هم میگیرید این شکلی حرمت همو نگه دارید

فراستی: من این زباله ها را دیدم! شوخی‌های جنسی را در این فیلم‌ها به حدی رسانده‌اید که...| ببینید

play

فراستی: من این زباله ها را دیدم! شوخی‌های جنسی را در این فیلم‌ها به حدی رسانده‌اید که...| ببینید

بیشتر ببینید ›

از بین اخبار

تذکر رهبر انقلاب به وزیر کار : مخاطب خودت هستی! | ویدئو

تذکر رهبر انقلاب به وزیر کار : مخاطب خودت هستی! | ویدئو

رقیب آیفون ۱۶ پرو و گلکسی S25 اولترا؛ تصاویر و مشخصات گوشی جدید سونی لو رفت

رقیب آیفون ۱۶ پرو و گلکسی S25 اولترا؛ تصاویر و مشخصات گوشی جدید سونی لو رفت

معامله ۴۲۵کیلوگرم شمش نقره و ۳۲۰کیلوگرم شمش طلا در بورس کالا

معامله ۴۲۵کیلوگرم شمش نقره و ۳۲۰کیلوگرم شمش طلا در بورس کالا

پوستر پرستاره نماینده ایران برای لیگ قهرمانان آسیا

پوستر پرستاره نماینده ایران برای لیگ قهرمانان آسیا

ابتلا به مسمومیت با مصرف زیاد این ویتامین

ابتلا به مسمومیت با مصرف زیاد این ویتامین

پاپ جدید، لیسانس ریاضی دارد

پاپ جدید، لیسانس ریاضی دارد

ویتکاف: ایران باید تاسیسات نطنز، فردو و اصفهان را برچیند

ویتکاف: ایران باید تاسیسات نطنز، فردو و اصفهان را برچیند

دبیرخانه همایش بین‌المللی گردشگری سلامت در همدان افتتاح شد

دبیرخانه همایش بین‌المللی گردشگری سلامت در همدان افتتاح شد

نماینده هرمزگان: توانیر قول داد استان از جدول خاموشی خارج شود

نماینده هرمزگان: توانیر قول داد استان از جدول خاموشی خارج شود

کنایه تند زیدآبادی به رسایی؛ مبدأ ارسال پیامک های حجاب ذهنیت کسانی است که از علی تا بوعلی را در تاریخ تکفیر کرده‌اند

کنایه تند زیدآبادی به رسایی؛ مبدأ ارسال پیامک های حجاب ذهنیت کسانی است که از علی تا بوعلی را در تاریخ تکفیر کرده‌اند

سه ارز دیجیتال مطرح در هفته سوم ماه مه ۲۰۲۵

سه ارز دیجیتال مطرح در هفته سوم ماه مه ۲۰۲۵

حکایت‌های سعدی در گلستان / باب اول در سیرت پادشاهان؛ حکایت شماره 22 + فایل صوتی و نگاهی به نسخه‌های قدیمی

حکایت‌های سعدی در گلستان / باب اول در سیرت پادشاهان؛ حکایت شماره 22 + فایل صوتی و نگاهی به نسخه‌های قدیمی