back to top

शोधकर्ताओं ने एलएलएम में ‘विनाशकारी भूलने’ के लिए एक स्व-आसवन समाधान का प्रस्ताव दिया है

Date:

प्रशिक्षण के दौरान एक ही मॉडल दो भूमिकाएँ निभाता है। एक शिक्षक संस्करण क्वेरी और विशेषज्ञ उदाहरण दोनों पर आधारित होता है। एक छात्र संस्करण केवल क्वेरी देखता है, जो वास्तविक दुनिया की तैनाती को दर्शाता है। छात्र अपने स्वयं के उत्पन्न आउटपुट पर शिक्षक की भविष्यवाणियों के साथ संरेखित करने के लिए अपने मापदंडों को अपडेट करता है।

शोधकर्ताओं ने कहा, “अनुक्रमिक सीखने के प्रयोगों में, एसडीएफटी एक एकल मॉडल को प्रदर्शन प्रतिगमन के बिना समय के साथ कई कौशल जमा करने में सक्षम बनाता है, प्रदर्शनों से निरंतर सीखने के लिए एक व्यावहारिक मार्ग के रूप में ऑन-पॉलिसी डिस्टिलेशन स्थापित करता है।”

चुनौतियों पर काबू पाना है

ओमडिया के मुख्य विश्लेषक लियान जे सु के अनुसार, एसडीएफटी काफी यथार्थवादी प्रतीत होता है क्योंकि तकनीक अलग-अलग एडेप्टर या फाइन-ट्यून किए गए वेरिएंट के “मॉडल चिड़ियाघर” को बनाए रखने की आवश्यकता को हटा देती है।

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Share post:

Subscribe

spot_imgspot_img

Popular

More like this
Related

OpenAI के कोडेक्स का एक नया संस्करण एक नई समर्पित चिप द्वारा संचालित है

गुरुवार को, OpenAI ने अपने एजेंटिक कोडिंग टूल कोडेक्स...

बेहतर व्यावसायिक निर्णयों के लिए व्याख्या योग्य एआई का लाभ कैसे उठाएं

मेरे पास ऐसे अनगिनत संगठन हैं जो उससे कहीं...

A Gentle Introduction to Graph Neural Networks

This article is one of two Distill publications about...