Show HN: Sidan U Kordhiyey HuggingFace Furan Hoggaanka LLM ee Labada GPUs ee Ciyaaraha
Marka aad maqashid nooc cusub oo luqad furan oo casri ah, waxaad u badan tahay inaad sawirto shaybaar cilmi baaris oo ay ku jiraan koox ka kooban A100 ama H100 GPUs. Uma malaynaysid in a habayn humming iska in a guriga, ku shaqeeya kaararka garaafyada la mid ah loo isticmaalo in lagu ciyaaro Cyberpunk 2077. Laakiin taasi waa dhab ahaan waxa aan loo isticmaalo in lagu tababaro model in dhawaan fuulay xagga sare ee HuggingFace Open LLM Leaderboard. Socdaalkani ma ahayn oo kaliya awood ceeriin; waxay ku saabsanayd maaraynta kheyraadka caqliga leh, doorashooyinka istaraatiijiga ah, iyo ka faa'iidaysiga aaladaha saxda ah -mabaadi'da si qoto dheer uga falcelisa sida aan uga fikirno hufnaantaMewayz, ganacsiga modular OS ee loogu talagalay in lagu caawiyo kooxaha yaryar si ay u gaaraan natiijooyin heer shirkadeed.
Qalabka Humble: Samaynta FLOP kasta
Aasaaska mashruucani wuxuu ahaa mid aan la dafiri karin oo dhexdhexaad ah: laba NVIDIA RTX 4090 ciyaaraha GPUs oo leh 24GB ee VRAM midkiiba. Iyadoo awood u leh macaamiisha, tani waa qayb ka mid ah xisaabinta sida caadiga ah loo qoondeeyay tababarka qaabka luqadda ee ballaaran. Caqabadda degdega ah waxay ahayd xusuusta. Ku-habaynta moodeel balaayiin cabbirro ah, oo ay weheliyaan dawlad-goboleedka kobciya iyo jaangooyooyinkooda, 48GB ee wadarta VRAM waxay u baahday beddelka hab-dhaqannada caadiga ah. Kaliya ma qaadi karo moodelka iyo xogta oo ku dhuftay "orod." Taa beddelkeeda, waxaan u jeestay koox farsamooyin wax ku ool ah:
Quantization:Tababarka moodeelka ee saxda ah ee 8-bit waxay si aad ah hoos ugu dhigtay raadadka xusuusta ee miisaanka iyo firfircoonida iyada oo aan la lumin wax qabad muuqda.
Checkpointing Gradient: Farsamadani waxay ka beddeshaa xisaabinta xusuusta iyadoo si xushmad leh dib u xisaabinaysa firfircoonida inta lagu jiro baaska dambe, halkii ay wada kaydin lahayd.
LoRA (Laqabsiga darajada hoose): Tani waxay yaraynaysaa tirada qiyaasaha la tababari karo iyadoo la raacayo amarrada cabbirka.
Habkan kor loogu qaadayo kheyraadka xaddidan waa aasaaska falsafadaMewayz. Sida aan u wanaajino socodka shaqada si aan u baabi'inno hawlaha aan badnayn oo aan si otomaatig ah u samayno hababka, tayaynta ilaha xisaabinta ayaa fure u ah in lagu gaadho natiijooyin waaweyn iyada oo la adeegsanayo habayn caato ah.
Waxtarka qalabku waa kala bar dagaalka. Tayada xogta tababarka ayaa la odhan karaa waa mid aad muhiim u ah. Guddidu waxay qiimeysaa moodooyinka hawlaha sida caqli-gal, su'aal-jawaab, iyo run-sheegnimo. Si uu sare ugu kaco, moodeelku waxa uu u baahday in uu wax ka barto xog-ururin, kala duwan, iyo tayo sare leh. Waxaan ku qaatay waqti ka badan nadiifinta iyo nadiifinta xogta intii aan dhab ahaantii tababbaray qaabka. Tani waxay ku lug lahayd kala-saarid, shaandhaynta tayada, iyo hubinta matalaad dheellitiran ee hawlo kala duwan.
"Waxqabadka moodeelku waa mid si toos ah uga tarjumaya xogta uu isticmaalo. Qashinka gudaha, qashinka ayaa ah sharciga ugu horreeya ee barashada mashiinka. Xog nadiif ah oo si fiican loo habeeyey ayaa ka qiimo badan saacadaha 100 GPU ee dheeraadka ah."
Fiiro gaar ah u leh daacadnimada xogta ayaa muraayaddaMewayzee diiradda saaraysa xogta nadiifka ah, dhexe. Marka la isku daro qalabyada kala duwan ee hal il oo runta ah, Mewayz waxay hubisaa in go'aamada ganacsiga lagu gaaro macluumaad sax ah oo la isku halleyn karo - mabda'a si siman muhiim u ah tababarka AI-waxqabadka sare leh.
Abaabulka Orodka Tababarka
Iyadoo la qeexay caqabadaha qalabka iyo xogta la diyaariyay, tillaabada xigta waxay ahayd abaabul. Waxaan isticmaalay Hugging Face's deegaanka deegaanka, gaar ahaan 'transformers' iyo 'datasets' maktabadaha, si aan u hagaajiyo dhuumaha. Tababarka waxaa lagu maareeyay si qoto dheer si si hufan loo jeexjeexo moodeelka iyo hagaajinta gobolada ee labada GPUs. Nidaamku ma ahayn mid degdeg ah; waxa ay socotay in ka badan hal todobaad, una baahan kormeer joogto ah si loo habeeyo heerarka waxbarashada oo loo qabto xasillooni darro iman karta. Habkan soo noqnoqonaya-kormeerka, hagaajinta, iyo wanaajinta-waa nooc ka mid ah horumarka firfircoon. Waa isla sifayn isku celcelin ah oo aanu ku guulaysanayMewayzmarkaan caawinayna kooxuhu inay soo saaraan hannaan ganacsi oo cusub, halkaas oo horumar yar oo joogto ah ay horseeddo natiijooyinka muddada-dheer ee ugu wanaagsan.
Ku-kordhinta sabuuradda hoggaaminta ee GPU-yada ciyaaraha maahan uun guul-gaar shaqsiyeed; waa calaamad ku socota bulshada. Waxay muujineysaa in xannibaadda gelitaanka cilmi-baarista AI ee cidhiidhiga ah ay ka hooseyso sida ay dad badani u maleynayaan. Isku darka farsamooyinka software wax ku ool ah iyo awood badan, qalabka macaamiisha la heli karo ayaa dimuqraadiyeynaya horumarinta AI. Tani waxay si buuxda ula socotaa hadafkaMewayz: in la dimoqraadiyeeyo qalabka ganacsiga ee xoogga leh, samaynta hufnaan hawleed oo casri ah oo ay heli karaan kooxo kala duwan. Uma baahnid miisaaniyad ballaaran si aad u gaarto natiijooyin heer sare ah, haddii aad tababareyso AI ama aad wado ganacsi. Waxaad u baahan tahay istiraatijiyad caqli-gal ah, qalabka hab-habboon ee saxda ah, iyo go'aan ka gaarista sida ugu badan ee aad uga faa'iidaysan karto waxa aad haysato.
Su'aalaha Inta badan La Isweydiiyo
Show HN: Sidan U Kordhiyey HuggingFace Furan Hoggaanka LLM ee Labada GPUs ee Ciyaaraha
Marka aad maqashid nooc cusub oo luqad furan oo casri ah, waxaad u badan tahay inaad sawirto shaybaar cilmi baaris oo ay ku jiraan koox ka kooban A100 ama H100 GPUs. Uma malaynaysid in a habayn humming iska in a guriga, ku shaqeeya kaararka garaafyada la mid ah loo isticmaalo in lagu ciyaaro Cyberpunk 2077. Laakiin taasi waa dhab ahaan waxa aan loo isticmaalo in lagu tababaro model in dhawaan fuulay xagga sare ee HuggingFace Open LLM Leaderboard. Socdaalkani ma ahayn oo kaliya awood ceeriin; waxay ku saabsanayd maaraynta kheyraadka caqliga leh, doorashooyinka istaraatiijiga ah, iyo ka faa'iidaysiga aaladaha saxda ah—mabaadi'da si qoto dheer uga falcelisa sida aan uga fikirno hufnaanta Mewayz, OS-ka ganacsiga casriga ah ee loogu talagalay in lagu caawiyo kooxaha yaryar inay gaaraan natiijooyin heer shirkadeed.
Hardware-ka Humble: Samaynta FLOP kasta
Aasaaska mashruucani wuxuu ahaa mid aan la dafiri karin oo dhexdhexaad ah: laba NVIDIA RTX 4090 ciyaaraha GPUs oo leh 24GB ee VRAM midkiiba. Iyadoo awood u leh macaamiisha, tani waa qayb ka mid ah xisaabinta sida caadiga ah loo qoondeeyay tababarka qaabka luqadda ee ballaaran. Caqabadda degdega ah waxay ahayd xusuusta. Ku-habaynta moodeel balaayiin cabbirro ah, oo ay weheliyaan dawlad-goboleedka kobciya iyo jaangooyooyinkooda, 48GB ee wadarta VRAM waxay u baahday beddelka hab-dhaqannada caadiga ah. Kaliya ma qaadi karo moodelka iyo xogta oo ku dhuftay "orod." Taa beddelkeeda, waxaan u jeestay koox farsamooyin wax ku ool ah:
Waxtarka qalabku waa kala bar dagaalka. Tayada xogta tababarka ayaa la odhan karaa waa mid aad muhiim u ah. Guddidu waxay qiimeysaa moodooyinka hawlaha sida caqli-gal, su'aal-jawaab, iyo run-sheegnimo. Si uu sare ugu kaco, moodeelku waxa uu u baahday in uu wax ka barto xog-ururin, kala duwan, iyo tayo sare leh. Waxaan ku qaatay waqti ka badan nadiifinta iyo nadiifinta xogta intii aan dhab ahaantii tababbaray qaabka. Tani waxay ku lug lahayd kala-saarid, shaandhaynta tayada, iyo hubinta matalaad dheellitiran ee hawlo kala duwan.
Abaabulka Orodka Tababarka
Iyadoo la qeexay caqabadaha qalabka iyo xogta la diyaariyay, tillaabada xigta waxay ahayd abaabul. Waxaan isticmaalay Hugging Face's deegaanka deegaanka, gaar ahaan 'transformers' iyo 'datasets' maktabadaha, si aan u hagaajiyo dhuumaha. Tababarka waxaa lagu maareeyay si qoto dheer si si hufan loo jeexjeexo moodeelka iyo hagaajinta gobolada ee labada GPUs. Nidaamku ma ahayn mid degdeg ah; waxa ay socotay in ka badan hal todobaad, una baahan kormeer joogto ah si loo habeeyo heerarka waxbarashada oo loo qabto xasillooni darro iman karta. Habkan soo noqnoqonaya-kormeerka, hagaajinta, iyo wanaajinta-waa nooc ka mid ah horumarka firfircoon. Waa isla sifayn isku celcelin ah oo aanu ku guulaysanay Mewayz markii aanu caawinaynay kooxuhu inay soo saaraan habab ganacsi oo cusub, halkaas oo horumar yar oo joogto ah u horseedo natiijooyinka muddada fog ee ugu wanaagsan.
Waxay tani uga dhigan tahay mustaqbalka
Ku-kordhinta sabuuradda hoggaaminta ee GPU-yada ciyaaraha maahan uun guul-gaar shaqsiyeed; waa calaamad ku socota bulshada. Waxay muujineysaa in xannibaadda gelitaanka cilmi-baarista AI ee cidhiidhiga ah ay ka hooseyso sida ay dad badani u maleynayaan. Isku darka farsamooyinka software wax ku ool ah iyo awood badan, qalabka macaamiisha la heli karo ayaa dimuqraadiyeynaya horumarinta AI. Tani waxay si buuxda ula jaan qaadaysaa himilada Mewayz: in la dimoqraadiyeeyo aaladaha ganacsiga ee xoogga leh, samaynta hufnaan hawleed oo casri ah oo ay heli karaan kooxo kala duwan. Uma baahnid miisaaniyad ballaaran si aad u gaarto natiijooyin heer sare ah, haddii aad tababareyso AI ama aad wado ganacsi. Waxaad u baahan tahay istiraatijiyad caqli-gal ah, qalabka hab-habboon ee saxda ah, iyo go'aan ka gaarista sida ugu badan ee aad uga faa'iidaysan karto waxa aad haysato.
Dhammaan Qalabkaaga Ganacsi oo Hal Meel ah
Jooji jugling abka badan. Mewayz wuxuu isku daraa 208 qalab kaliya $49/bishii - laga bilaabo alaabada ilaa HR, ballansashada ilaa falanqaynta. Looma baahna kaarka deynta si loo bilaabo.