Több évnyi mesterséges intelligencia-fejlesztés után a Xiaomi második generációs nagy nyelvi modelljének, a MiLM2-nek a legújabb frissítése a modell architektúrája, adatminősége és alkalmazási köre tekintetében jobb verziót mutat be a 2023-ban megjelent első generációhoz, a MiLM-hez képest. A MiLM2 az intelligens és összekapcsolt környezet megvalósításának középpontjában áll – a Xiaomi célja a “Teljes ökoszisztéma az emberek, autók és otthonok számára”.
A MiLM2 legfontosabb fejlesztései
Mindazonáltal, a hosszú és rövid az, hogy a Xiaomi MiLM2-t továbbfejlesztették, hogy megfeleljen a különböző igényeknek a mobileszközök, járművek, intelligens otthonok és sok más szférában. A MiLM2-t kiemelkedővé tevő alapvető fejlesztések a következők:
- Bővülő paramétermátrix és skálázhatóság: A 0,3 milliárd paramétertől kezdve, amely elég könnyű az eszközön történő használathoz, akár 30 milliárd paraméterig terjedhet a robusztus felhőfeladatokkal. Ez a méretbeli rugalmasság lehetővé teszi a Xiaomi számára, hogy a MiLM2-t az eszközök és a felhasználási esetek között alkalmazza, az okostelefonoktól a felhőalapú szolgáltatásokig, a használhatóság és a hatékonyság javítása érdekében. Optimalizálta a paraméterek körét a zökkenőmentes integráció érdekében a felhőben, az élekben és a végeszközökön, és megvalósította az AI-képességek zökkenőmentes folytonosságát a Xiaomi ökoszisztéma minden szintjén.
- Javított teljesítmény a kulcsfontosságú képességek tekintetében: Az első generációhoz képest a MiLM2 átlagosan 45%-os javulást ér el 10 kulcsfontosságú képességben, beleértve a parancskövetést, a fordítást és a társalgási képességeket. Ez utóbbi a MiLM2-t az iparági teljesítmény élvonalába emeli, és így rendkívül versenyképes más, hasonló méretű modellekkel szemben. Ez drámaian megnövelte a teljesítményt az olyan kulcsfontosságú feladatokban, mint a parancsfelismerés, a párbeszédkezelés és a fordítás, ami tovább erősíti az intelligens asszisztensként betöltött pozícióját, és támogatja a Xiaomi vízióját egy intelligens, a fogyasztókat kiszolgáló ökoszisztémáról.
- További On-Device Use következtetésgyorsítás: A MiLM2 három fő ügyfelet old meg: a nagy és kis modellspekulációt, a BiTA-t és a Medusa-t a modell következtetés kliensoldali felgyorsításával. A Xiaomiban saját fejlesztésű kvantálás jelentős mértékben hozzájárul ahhoz, hogy az iparági szabványokhoz képest 78%-kal csökkentse a kvantálási veszteséget; ezért jobban elfér az alacsony számítási teljesítményű eszközökön. A fejlesztések jobb és gyorsabb felhasználói élményt teremtenek az AI-okostelefonok és IoT-eszközök számára azáltal, hogy a külsőleg elérhető felhőforrásokra való alacsony támaszkodással biztosítanak érzékeny és hatékony AI-támogatást.
- Kibővített kontextusablak: A MiLM2 az első generáció 4000 tokenjéről lenyűgöző 200 000 tokenre növelte a kontextusablakot. A MiLM2 által biztosított nagyobb kontextus bonyolultabb, hosszú szövegek kezelésére és a felhasználói élmények további gazdagítása érdekében kiterjesztett beszélgetések követésére képes. Ez a képesség jól jön a sok adatfeldolgozást és -megértést igénylő alkalmazásoknál, mint például az ügyfélszolgálat vagy a mély szövegelemzés.
Átfogó tesztkészlet a MiLM2 számára: Mi-LLMBM2.0
A MiLM2 minőségi és sokszínűségi követelményeinek teljesítése érdekében a Xiaomi egy teljes értékelőkészletet készített Mi-LLMBM2.0 néven, amely 10 fő kategóriából és 170 altesztelemből áll. Ezek a kategóriák a következők:
- Szöveggenerálás
- Brainstorming
- A párbeszédek kezelése
- Kérdések megválaszolása
- Újraírás és összefoglalás
- Szövegosztályozás
- Adatkivonatolás
- Feldolgozási kód
- A válasz biztonságos generálása
A MiLM2-1.3B és a MiLM-2-6B értékelési eredményei például minden kategóriában jelentős javulást mutatnak, az első generációs modelleket kiindulópontnak tekintve, ami azt bizonyítja, hogy a MiLM2 jelentősen javult a funkcionalitás és a teljesítmény tekintetében.
A stratégiai modell változatai: Felhő, perem és végfelhasználás
A MiLM2-n belül a Xiaomi egy belső rugalmas modellmátrixot telepített a különböző felhasználási esetek támogatására:
- 0,3B – 6B paraméterek: Leginkább az eszközön vagy terminálon történő felhasználási esetekre alkalmas. Skálázható változatosabb, különböző hardveres képességekkel rendelkező eszközökre, lehetővé téve a jobb teljesítményoptimalizálást az eszközök között. Ezek a kisebb modellek lehetővé teszik az alacsony számítási képességekkel rendelkező eszközökön az AI-val való hatékonyabb interakciót.
- Modellek 6B és 13B paraméterekkel: Ez a modell a többfeladatos, zéró lövéses tanulási feladatokat célozza. Ezek a modellek meglehetősen jól teljesítenek az általános célú AI-funkciókhoz számos Xiaomi termékben.
- 30B Paraméterek: Ez a sokkal erősebb felhőmodell nagyon összetett, magas szintű érvelést igénylő feladatokat tud kezelni: többdimenziós elemzést és utasításkövetést, amelyek kiterjesztettek.
MoE modellek a hatékonyságért és a teljesítményért
A MiLM2 második generációja bevezeti a MoE modelleket: MiLM2-0.7B×8 és MiLM2-2B×8. Ezek a MoE-modellek több “szakértői” modulból állnak, amelyek mindegyike egy-egy konkrét feladat elvégzésével van megbízva. Például a MiLM2-2B×8 modell, bár kevesebb paraméterrel rendelkezik, a MiLM2-6B modellhez hasonló teljesítményt nyújt, de a dekódolási sebesség 50%-kal javul. Ez az architektúra rendkívül hatékony modellt biztosít, a modell pontosságának csaknem elhanyagolható mértékű romlása mellett.
Áttörések az eszközön történő telepítésben: Az új 4B modell A MiLM2 egy lépéssel továbblépett a mesterséges intelligencia eszközre történő telepítése terén a kifejezetten ügyféloldali forgatókönyvekhez tervezett új 4B modellel. A Xiaomi “TransAct Big Model Structured Pruning Method” hatékonyan képes a metszésre, 92%-kal csökkentve a számítási ráfordítást, miközben rendkívül nagy pontosságot biztosít. A modell teljesítményének további optimalizálását a Xiaomi tulajdonában lévő, szabadalmaztatott “végoldali kvantálási módszerek” biztosítják. A Xiaomi ilyen kvantálása 78%-kal csökkenti a pontosságveszteséget a Qualcomm megoldásához képest, amelyet iparági viszonyítási alapként használ.
30B modell felhőalkalmazásokhoz
A MiLM2-30B a Xiaomi legmodernebb felhőalapú AI-modellje, amely még nagyobb kihívást jelentő környezetben nagy terhelésű feladatok elvégzésére irányul. Kiemelkedő többfeladatos feldolgozási teljesítménnyel, kiváló utasításkövetéssel, mélyreható elemzéssel és összetett alkalmazási forgatókönyvekkel rendelkezik. Továbbá olyan összetettebb alkalmazásokhoz, mint a Xiaomi HyperOS, az intelligens ügyfélszolgálat és a Xiaomi járművek intelligens pilótafülkéje.
Valós világbeli alkalmazások: Xiaomi “Teljes ökoszisztéma az emberek, az autók és az otthonok számára”
A “Full Ecosystem for People, Cars, and Homes” elnevezésű stratégiában nagyon fontos lesz az átfogó sorozata. Egy összekapcsolt, mesterséges intelligencia által vezérelt élmény – a MiLM2 – életmódot fog tervezni a Xiaomi csúcstechnológiás kütyüit használó emberek számára, az okostelefonoktól kezdve az okos háztartási készülékeken át az autókig. A példa-forgatókönyvek közé tartozhatnak:
- A Xiaomi autókban: A MiLM2 javítja a valós idejű navigációt, a nyelvi fordítást és még a beszélgetéseket is, hogy az autóban töltött idő igazán kényelmes legyen.
- Az intelligens otthonokban: A MiLM2 javítja az IoT-eszközök vezérlését azáltal, hogy intuitívabb hangutasításokat tesz lehetővé, és alkalmazkodik a felhasználó preferenciaválaszaihoz. In-Mobile: A Xiaomi Xiaoai asszisztensének felhatalmazása a MiLM2-vel a jobb állítások végrehajtásához és a beszélgetés kontextuális megértéséhez, ami elengedhetetlenül fontos lett az okostelefonok okosabbá és az élmény még személyesebbé tételéhez.
A MiLM2 bevezetése nagyon fontos mérföldkő a Xiaomi mesterséges intelligencia útján. A második generációval a MiLM2 közelebb kerül az elképzelés megvalósításához: a zökkenőmentes összekapcsolhatóság egy intelligens ökoszisztémában, amely az élet minden területét kiszolgálja. A MiLM2 pozicionálása a szélesebb és sokkal erősebb paraméterkészlet, a következtetési képesség és a modellek telepítése érdekében továbbra is új szabványokat állít fel a fogyasztói elektronikai AI terén. Ezért a MiLM2 lesz az egyik alapja a mesterséges intelligencia további fejlődésének, mivel a Xiaomi folytatja a stratégiáját, amelynek célja egy szuperintelligens ökoszisztéma radikális létrehozása, ahol az emberek, az autók és az otthonok szervesen integrálódnak. A MiLM2 az intelligens élet egy újabb évtizedét nyitja meg, és megerősíti, hogy a Xiaomi nem áll meg a fejlesztésben, hogy elmozdítsa az AI technológia kereteit.