Hugging Face
A Hugging Face egy platform, amely eszközöket biztosít gépi tanulási modellek készítéséhez, betanításához és telepítéséhez. Gazdag előre betanított modell-könyvtárat és felhasználóbarát eszközöket kínál, lehetővé téve a fejlesztők és kutatók számára, hogy hatékonyan hozzanak létre és optimalizáljanak modern ML modelleket különböző feladatokhoz, különösen a természetes nyelvfeldolgozás területén.
Beállítás előtt
Mielőtt csatlakozna, a következőkre van szüksége:
- Hugging Face fiók létrehozása.
- Hozzáférési token beszerzése:
- Kattintson az New token gombra.
- Adjon meg egy Name nevet a tokenhez és válassza ki a Role szerepkört a legördülő menüből.
- Kattintson a Generate a token gombra.
- A generált token mellett kattintson a Copy token to clipboard ikonra.
Modell betanítása vagy finomhangolása egyéni adatokkal
A Hugging Face eszközt biztosít ML modellek betanítására, amely használható az igényekhez való jobb alkalmazkodáshoz. Az AutoTrainről itt olvashat bővebben. Miután a modellt betanította a saját adataival, a Blackbirden keresztül ugyanúgy használhatja, mint bármely más modellt.
Csatlakozás
- Navigáljon az alkalmazásokhoz és keressen rá a Hugging Face-re. Ha nem találja a Hugging Face-t, kattintson a jobb felső sarokban található Add App gombra, válassza a Hugging Face-t, és adja hozzá az alkalmazást a Blackbird környezetéhez.
- Kattintson az Add Connection gombra.
- Nevezze el a kapcsolatot a későbbi hivatkozáshoz, pl. ‘Saját szervezet’.
- Töltse ki az előző részben megszerzett API tokent.
- Kattintson a Connect gombra.
- Ellenőrizze, hogy a kapcsolat megjelent-e és a státusza Connected.
Actions
Text
- Summarize text hosszabb szöveget rövidebb szöveggé foglal össze.
- Answer question megválaszol egy kérdést a megadott kontextus alapján. A kontextus az a szöveg, ahol a válasz megtalálható.
- Answer question with table megválaszol egy kérdést a megadott .xlsx kiterjesztésű Excel-táblázat alapján, ahol a válasz megtalálható.
- Classify text szövegbesorolást végez. A lehetséges címkék a használt modelltől függően változnak. Hasznos lehet például hangulatelemzéshez.
- Classify text according to candidate labels szövegbesorolást végez, és a Classify text művelettel ellentétben a megadott címkéket használja a jósláshoz.
- Translate text. A forrás- és célnyelv nem adható meg. Ajánlott olyan modelleket használni, amelyeket egy nyelvpár közötti fordításra tanítottak be. Például tekintse meg a Helsinki-NLP modelleket.
- Fill mask kitölti a hiányzó szavakat és visszaadja a kitöltött szöveget. Használjon maszk tokent a kitöltendő hely megadásához. A maszk token modellenként eltérő lehet, de a leggyakrabban használt tokenek a [MASK] vagy <mask>. Ellenőrizze az adott modell által használt maszk tokent annak Hugging Face oldalán.
- Calculate semantic similarity kiszámítja két szöveg szemantikai hasonlóságát és visszaadja a hasonlósági pontszámot 0-tól 1-ig terjedő tartományban.
- Generate text folytatja a szöveget egy kezdő prompt alapján.
- Chat beszélgetési feladatot hajt végre. Kontextus biztosításához megadhat korábbi felhasználói bemeneteket és korábban generált válaszokat, amelyeknek azonos hosszúságúaknak kell lenniük.
- Classify tokens token osztályozást végez. Általában kulcsszavak kinyerésére vagy nyelvtani mondatelemzésre használják. A modell használatát és az entitáscsoportokat (címkéket) az adott modell Hugging Face oldalán ellenőrizheti.
- Generate embedding szöveg beágyazást generál - lebegőpontos számok listáját, amely megragadja az általa képviselt szöveg szemantikai információit. A beágyazások használhatók adatok tárolására vektor adatbázisokban (mint a Pinecone).
Audio
- Create transcription átírást generál egy hangfájl alapján (Flac, Wav, Mp3, Ogg stb.).
- Classify audio hang osztályozást végez. A lehetséges címkék a használt modelltől függően változnak.
Image
- Generate image képet generál a kép szöveges leírása alapján.
- Classify image kép osztályozást végez. A lehetséges címkék a használt modelltől függően változnak.
- Convert image to text szöveges leírást generál a megadott képhez.
- Answer question based on image vizuális kérdésmegválaszolást végez a megadott kép alapján.
Megjegyzés: sok műveletnek van egy opcionális bemeneti paramétere: Use cache. Alapértelmezés szerint ez true értékre van állítva, ami azt jelenti, hogy ha a modell már látta ugyanazt a bemenetet, akkor a korábban kapott eredményt adja vissza. Ezt használhatja annak biztosítására, hogy determinisztikus eredményeket kapjon. Ha nem szeretné, hogy a modell pontosan ugyanazokat az eredményeket adja vissza a korábban látott lekérdezésekre, állítsa a Use cache értéket false-ra.
Hiányzó funkciók
A jövőben hozzáadhatunk műveleteket a következőkhöz:
- Képfelismerés
- Képszegmentáció
Tudassa velünk, ha érdekli!