استاندارد جدید OpenAI برای سنجش هوش مصنوعی در پزشکی

OpenAI با معرفی مدل جدید HealthBench گامی نو در ارزیابی عملکرد مدل‌های هوش مصنوعی در حوزه سلامت برداشته است. این مدل با همکاری ۲۶۲ پزشک از ۶۰ کشور و بر پایه ۵ هزار گفت‌وگوی واقعی ساخته شده و می‌تواند عملکرد ابزارهای هوش مصنوعی را در پاسخ به سؤالات پزشکی به‌صورت دقیق و با معیارهای تخصصی بسنجد. HealthBench نه‌تنها رقابتی جدی میان مدل‌های پیشرفته ایجاد کرده، بلکه به ابزاری راهبردی برای اعتمادسازی در حوزه سلامت دیجیتال تبدیل شده است.

انتقال به متن خبر بعد از سی ثانیه