كشفت Deepgram النقاب عن Nova-3 Medical ، وهو نموذج الذكاء الاصطناعي لتحويل الكلام إلى نص (STT) مصمم للنسخ في بيئة الرعاية الصحية الصعبة.
تهدف Nova-3 Medical ، المصممة للتكامل بسلاسة مع سير العمل السريري الحالي ، إلى تلبية الحاجة المتزايدة للنسخ الدقيق والفعال في NHS العامة في المملكة المتحدة ومشهد الرعاية الصحية الخاصة.
نظرا لأن السجلات الصحية الإلكترونية (EHRs) والتطبيب عن بعد ومنصات الصحة الرقمية أصبحت منتشرة بشكل متزايد ، فإن الطلب على النسخ الموثوق به الذي يعمل بالطاقة الذكاء الاصطناعي لم يكن أعلى من أي وقت مضى.
مع ذلك ، غالبا ما تكافح نماذج تحويل الكلام التقليدية إلى نص مع المفردات المعقدة والمتخصصة المستخدمة في الإعدادات السريرية ، مما يؤدي إلى أخطاء و “هلوسة” يمكن أن تعرض رعاية المرضى للخطر.
تم تصميم Nova-3 Medical من Deepgram للتغلب على هذه التحديات. يستفيد النموذج من التعلم الآلي المتقدم والتدريب على المفردات الطبية المتخصصة لالتقاط المصطلحات الطبية والاختصارات والمصطلحات السريرية بدقة – حتى في ظروف الصوت الصعبة.
هذا أمر بالغ الأهمية بشكل خاص في البيئات التي قد يبتعد فيها المتخصصون في الرعاية الصحية عن أجهزة التسجيل.
قال سكوت ستيفنسون ، الرئيس التنفيذي لشركة Deepgram: “تمثل Nova-3 Medical قفزة كبيرة إلى الأمام في التزامنا بتحويل الوثائق السريرية من خلال الذكاء الاصطناعي”. “من خلال معالجة الفروق الدقيقة في اللغة السريرية وتقديم تخصيص غير مسبوق ، فإننا نمكن المطورين من بناء منتجات تعمل على تحسين رعاية المرضى والكفاءة التشغيلية.”
تتمثل إحدى الميزات الرئيسية للنموذج في قدرته على تقديم نسخ منظمة تتكامل بسلاسة مع سير العمل السريري وأنظمة السجلات الصحية الإلكترونية ، مما يضمن تنظيم بيانات المريض الحيوية بدقة والوصول إليها بسهولة.
يوفر النموذج أيضا تخصيصا مرنا للخدمة الذاتية ، بما في ذلك Keyterm Prompting لما يصل إلى 100 مصطلح رئيسي ، مما يسمح للمطورين بتخصيص الحل وفقا للاحتياجات الفريدة لمختلف التخصصات الطبية.
تضمن خيارات النشر متعددة الاستخدامات – بما في ذلك تكوينات السحابة الخاصة الافتراضية (VPC) المحلية والافتراضية – الأمان على مستوى المؤسسات والامتثال لقانون نقل التأمين الصحي والمساءلة (HIPAA)، وهو أمر بالغ الأهمية لتلبية لوائح حماية البيانات في المملكة المتحدة.
قال كيفن فريدريك ، الشريك الإداري في OneReach.ai: “إن تحويل الكلام إلى نص لحالات استخدام المؤسسات ليس تافها ، وهناك فرق أساسي بين منصات الصوت الذكاء الاصطناعي المصممة لحالات استخدام المؤسسات مقابل حالات الاستخدام الترفيهية”.
“يعد نموذج Nova-3 من Deepgram ونموذج Nova-3-Medical رائدين في عروض الذكاء الاصطناعي الصوتي ، بما في ذلك TTS ، من حيث الدقة والكمون والكفاءة وقابلية التوسع المطلوبة لحالات استخدام المؤسسات.”
قياس Nova-3 Medical: الدقة والسرعة والكفاءة
أجرت Deepgram معايير مرجعية لإثبات أداء Nova-3 Medical. يدعي النموذج أنه يقدم دقة نسخ رائدة في الصناعة ، مما يحسن التعرف على الكلمات بشكل عام ودقة المصطلحات الطبية الحرجة.
- معدل خطأ الكلمات (WER): مع متوسط WER يبلغ 3.45٪ ، تتفوق Nova-3 Medical على المنافسين ، محققة انخفاضا بنسبة 63.6٪ في الأخطاء مقارنة بثاني أفضل منافس. تعمل هذه الدقة المحسنة على تقليل التصحيحات اليدوية وتبسيط سير العمل.
- معدل خطأ الكلمات الرئيسية (KER): بشكل حاسم ، حققت Nova-3 Medical معدل KER بنسبة 6.79٪ ، مما يمثل انخفاضا بنسبة 40.35٪ في الأخطاء مقارنة بأفضل منافس تالي.
- هذا يضمن نسخ المصطلحات الطبية الهامة – مثل أسماء الأدوية وشرواتها – بدقة، مما يقلل من مخاطر سوء التواصل وقضايا سلامة المرضى.
بالإضافة إلى الدقة ، تتفوق Nova-3 Medical في التطبيقات في الوقت الفعلي. يقوم النموذج بنسخ الكلام بسرعة 5-40 مرة أسرع من العديد من بائعي التعرف على الكلام البديل ، مما يجعله مثاليا للتطبيب عن بعد ومنصات الصحة الرقمية. تضمن بنيتها القابلة للتطوير أداء عاليا حتى مع زيادة أحجام النسخ.
علاوة على ذلك ، تم تصميم Nova-3 Medical لتكون فعالة من حيث التكلفة. بدءا من 0.0077 دولارا في الدقيقة من دفق الصوت – والذي تدعي Deepgram أنه ميسور التكلفة أكثر من ضعف مزودي الخدمات السحابية الرائدين – فإنه يسمح لشركات تكنولوجيا الرعاية الصحية بإعادة الاستثمار في الابتكار وتسريع تطوير المنتجات.
يهدف Nova-3 Medical من Deepgram إلى تمكين المطورين من بناء تطبيقات نسخ طبية تحويلية ، مما يؤدي إلى نتائج استثنائية عبر الرعاية الصحية.
المصدر: artificialintelligence