لماذا لا يمكنني استخدام chatgpt لكل شيء؟

لماذا لا يمكنني استخدام chatgpt لكل شيء؟

[ad_1]

Citrine Infaryatics عميل مراسل أعمال

تعد نماذج اللغة الكبيرة (LLMS) رائعة لبعض المهام – لكنها ليست مفيدة عندما تكون مجموعات البيانات التي تستخدمها للعمل صغيرًا ، والملكية الفكرية (IP) ثمينة كما هو الحال في تطوير منتجات المواد والمواد الكيميائية. لحسن الحظ ، LLMS ليست الحل الوحيد المتاح. يتم استخدام منصات SAAs الآلية المدركة كيميائيًا مثل تلك التي طورتها المعلوماتية للاستوين المعلوماتية بنجاح من قبل الشركات الرائدة لتسريع تطوير المنتجات.

منذ أن انفجرت Chatgpt إلى المشهد في نوفمبر 2022 ، تحولت الصورة الذهنية للجمهور عن الذكاء الاصطناعى من الروبوتات على غرار المنهي إلى دردشة مفيدة ، وإن كانت هلوسة إلى حد ما. يتم الآن تبني نماذج اللغة الكبيرة على نطاق واسع في الأعمال التجارية ، مما يجعل مساعدي الذكاء الاصطناعى شائعين. يتساءل العديد من المديرين التنفيذيين الآن ، هل يمكننا فقط Chatgpt كل شيء؟ على الرغم من أن LLMS رائعة في إعادة توحيد المعلومات الحالية بتنسيق جديد ، أو التأكد من أن هذه المقالة تتبع الاتفاقية النحوية ، إلا أنها تتمتع بنقاط ضعف تعني أنها ليست مناسبة للتطور المبتكر للمنتجات الفيزيائية والكيميائية.

هنا لماذا لن يعمل.

البيانات ليست جيدة بما يكفي ، أو كبيرة بما يكفي

لإنشاء نموذج لغة كبير ، تحتاج إلى مليارات نقاط بيانات النص. في حين تم بذل العديد من المحاولات لكشط البيانات العددية من المجلات العلمية وإنشاء قواعد بيانات كبيرة ، إلا أن جودة البيانات وأهميتها ليست جيدة بما يكفي لتدريب نموذج LLM. تعمل الشركات عادةً على إعادة صياغة منتج كيميائي حالي أو تطوير شيء جديد ومتطور ، وعادة ما تكون الوصفات لهذه المنتجات سرية. لن تجد بيانات عنها في المجلات العلمية العامة.

مصادر البيانات العامة مثل المجلات العلمية وبراءات الاختراع تقدم أيضًا التحيز. فقط ، يتم وضع الاختبارات الناجحة مع المواد عالية الأداء والمواد الكيميائية في الأوراق. الذكاء الاصطناعي ومع ذلك ، يحتاج إلى أمثلة على كل من الاختبارات الناجحة وغير الناجحة. إذا تم تدريبه فقط على البيانات من التجارب الناجحة ، فستعتقد أن جميع التجارب ناجحة!

ليس جيدًا بما فيه الكفاية: لا يمكن لنظام مراجعة النظراء التأكد من أن البيانات في الأوراق العلمية دقيقة (Getty Images)

لا يضمن نظام مراجعة النظراء أيضًا أن جميع البيانات في الأوراق العلمية دقيقة ومفصلة بدرجة كافية بحيث يمكنك التأكد من أنك تقارن التفاح بالتفاح. إذا كنت ترغب في تجميع البيانات معًا من أوراق منفصلة ، فأنت بحاجة إلى معرفة أنه تم اختبار المواد باستخدام نفس المنهجية ، وفي نفس الظروف. للأسف ، الكثير من الأوراق تترك المعلومات الحاسمة التي من شأنها أن تجعل هذا ممكنًا.

أفضل البيانات هي بياناتك الخاصة

أفضل مصدر لبيانات المواد والمواد الكيميائية هو مختبرك الخاص. عندما تكون كل نقطة بيانات نتيجة لتجربة تستغرق ساعات ، ستكون مجموعة البيانات الخاصة بك صغيرة. تبدأ معظم المشاريع على منصة Citrine (المنصة الرائدة للمواد والمواد الكيميائية AI) بـ 40 إلى 60 نقطة بيانات.

ثم يتم استكمال هذه المعلومات عن طريق اختيار أدمغة خبراء المنتج ، الذين يضيفون معرفتهم في المجال لضمان عدم اضطرار الذكاء الاصطناعى إلى إعادة تعلم قوانين الفيزياء ، والتوليد التلقائي للبيانات الإضافية من النماذج المادية بواسطة منصة الذكاء الاصطناعى. تتفهم منصة السترين التركيب الجزيئي والصيغ الكيميائية ويمكنها حساب أكثر من 100 خصائص من الاهتمام مثل الوزن الجزيئي أو متوسط ​​الكهربية تلقائيًا. وبهذه الطريقة ، يمكن للتعلم الآلي الاستفادة من مجموعات البيانات الصغيرة ولا يزال يسرع تطوير المنتج بعامل اثنين أو ثلاثة.

تتفهم منصة السترين التركيب الجزيئي والصيغ الكيميائية (السترين)

لماذا ستقودك LLMS

LLMS Remix المعلومات الحالية. على الرغم من أن هذا مفيد عند محاولة كتابة مقالة مدونتك ، إلا أنه سيقصر إذا طلبت منه التوصل إلى ابتكار جديد تمامًا. تقدم LLMs أيضًا كل شيء كحقيقة ، مع عدم وجود حساب دقيق لعدم اليقين في إجاباتهم ، وهو أمر أساسي عند المغامرة في مناطق جديدة تتجاوز فهمك الحالي.

التعلم المتسلسل باستخدام نماذج التعلم الآلي ، من ناحية أخرى ، هي عملية تكرارية تساعد خبراء المنتجات على استكشاف الحلول بطريقة أكثر كفاءة بكثير – ومن المرجح أن تحقق نتائج. يرى السترين عادةً انخفاضًا بنسبة 50-80 في المائة في عدد التجارب اللازمة لتحقيق أهداف تطوير المنتج مقارنة بنهج التجارب والخطأ. السبب الأساسي الذي يعمل هذا هو أن منصات التعلم الآلي لا تتنبأ بالخصائص فحسب ، بل أيضًا ، على عكس LLM ، تقدير مدى وجود هذه التنبؤات. عندما تذهب إلى المختبر لاختبار حل ممكن ، فأنت تعرف ما إذا كان رهانًا آمنًا أم بونت. يمكنك أن تكون أكثر استراتيجية في مسار الابتكار الخاص بك.

التفسير

LLMS هي أيضا أقل سهولة للتعلم. لا يمكنهم شرح سبب توصلهم إلى ما أنتجوه. هذا يعني أن خبراء المنتج لن يتمكنوا من استخدامها لاكتساب نظرة ثاقبة على العوامل الأساسية التي تؤثر على خصائصك المستهدفة. إذا كانت مهلوسة LLM ، فلن تعرف السبب ، لذلك لن تتمكن من إصلاحه.

LLMS؟ بالنسبة للعديد من التطبيقات ، إنها ربط مستدير في حفرة مربعة (السترين)

ML هو رهان أفضل

أفضل منصات التعلم الآلي تحسب أهمية الميزة وتوضح صريحًا العوامل التي تؤثر على تنبؤات النموذج ، بمقدار الاتجاه. في معظم الأوقات ، سيقوم خبير المنتج بمراجعة الأهمية في الأهمية للتحقق من أن نموذج الذكاء الاصطناعي على المسار الصحيح. في بعض الأحيان ، سيظهر عامل مهم بشكل غير متوقع ، مما دفع إلى استكشاف متحمس في اتجاه تصميم جديد.

باختصار ، لا يمكنك استخدام LLMs لكل شيء لأنها ، بالنسبة للعديد من التطبيقات ، هي ربط مستدير في حفرة مربعة. تتوفر أدوات أفضل للعلم الذكاء. أمضت شركات مثل Citrine Informatics عقدًا من الزمان في التغلب على تحدي مجموعات البيانات الصغيرة المتفرقة في كل مكان في تطبيقات R&D للمواد الكيميائية من خلال الاستفادة من معرفة خبراء المنتجات وجعل منصة AI سهلة الاستخدام ، واعتمية كيميائيًا.

لمعرفة المزيد ، يمكنك الوصول إلى هذا الملخص المكون من ثلاث صفحات لأكثر من عقد من الرؤى من تنفيذ الذكاء الاصطناعي في المواد والمواد الكيميائية والسلع المعبأة للمستهلك (CPG).

اطلب عرضًا تجريبيًا اليوم – انقر هنا للبدء!

[ad_2]

المصدر