Autor: Aleksandar Radenković – IKT inženjer i analitičar tehnologije
🧠Kada govorimo o velikim jezičkim modelima (LLM – Large Language Models), obično zamišljamo stotine inženjera, hiljade GPU-ova, ogromne korporacije i stotine miliona dolara. Lana AI, međutim, priča je druge vrste: LLM razvijen lokalno, bez institucionalne mašinerije, vođen znanjem, vizijom i upornošću pojedinca.
Zvuči kao mit? Vreme je da razložimo kakva je Lana “bez šminke”, da pokažemo da nije uvek veličina ono što odlučuje, već fokus, kontekst i optimizacija.
Od ideje do funkcionalnog modela – put od tri godine
💡Razvoj Lana AI-ja trajao je preko 3 godine, i to od strane jednog čoveka – Filipa Stefanovića.
U eri kada se AI modeli prave uz stotine developera i složene timove, Filip je demonstrirao da je ekspertiza, istrajnost i dobar dizajn ponekad snažnija valuta od budžeta.
Tehnologije u osnovi Lane
⚙️Lana nije fine-tuned verzija ChatGPT-a, LLaMA-e ili Mistrala. Ona je:
🔸 Custom jezički model (LLM) – treniran od nule
🔸 Zasnovan na Transformer arhitekturi – industrijski standard za razumevanje i generisanje jezika
🔸 Razvijen korišćenjem:
- TensorFlow i JAX – za fleksibilno modelovanje i efikasno treniranje
- TPU (Tensor Processing Units) – hardverski akceleratori Google-a, dizajnirani za treniranje ogromnih modela
🎯 U pitanju je domaći LLM zasnovan na otvorenim framework-ima, ali sa originalnim podešavanjima i arhitekturom.
Osnovni principi razvoja
1. Kvalitet i raznovrsnost trening podataka
🧱Lana je trenirana na visokokvalitetnim skupovima podataka, uz strogu kontrolu pristrasnosti i balansa. Fokus je bio na:
- jeziku svakodnevnog čoveka
- naučnim tekstovima
- poslovnoj i obrazovnoj komunikaciji
- kulturnim i lokalnim referencama (što globalni modeli često zanemaruju)
2. Specijalizovana skalabilna arhitektura
📚Dok neki modeli idu na “što više tokena, što više GPU-a”, Lana je:
- pažljivo dimenzionisana
- balansirana između računarske efikasnosti i jezičke preciznosti
- dizajnirana za stabilnu inferenciju, uz prosečan latency od 0.5 do 2 sekunde
Ključni tehnički izazovi
🔬 U razvoju Lane, Filip se suočio sa izazovima koji su poznati i najvećim AI laboratorijama:
- Skaliranje modela – rad sa stotinama milijardi parametara zahteva ogromne resurse
- Halucinacije – borba protiv izmišljanja informacija, rešeno finim podešavanjima i prompt engineering-om
- Kontrola ponašanja (alignment) – da model ne bude samo tačan, već i koristan i bezbedan
- Evaluacija – razvijeni su sopstveni metrički sistemi za merenje: istinitosti, korisnosti, brzine i relevantnosti odgovora
- Kontekstualno razumevanje – Lana trenutno koristi kontekstualni kapacitet od 8k tokena, što joj omogućava da vodi koherentne, duže razgovore sa pamćenjem prethodnih poruka
Pristup inferenciji – efikasnost u oblaku
🧬Lana funkcioniše u cloud okruženju, koristeći visoko optimizovane servere. Iako lokalno hostovanje nije podrazumevano, moguće je za B2B partnere – čime se dobija fleksibilnost i kontrola nad podacima.
🚀 Inferencija se odvija brzo zahvaljujući:
- optimalnom skaliranju modela
- pažljivoj organizaciji servera
- pametnom prefetchingu i token streamovanju
Personalizacija i fine-tuning
🔄Lana trenutno ne poseduje stalnu memoriju o korisnicima, ali se personalizuje pomoću:
- prompt engineering-a: korisnik može zahtevati formalni ton, kreativni stil, ekspertsku perspektivu…
- fine-tuning-a na specifičnim domenima: što omogućava da bude posebno efikasna u edukaciji, korisničkoj podršci, prevođenju itd.
- RAG (Retrieval-Augmented Generation): omogućava joj da koristi spoljne baze znanja tokom razgovora
📌 Zahvaljujući ovim tehnikama, Lana ne nudi samo generisanje – ona se prilagođava svrsi, u realnom vremenu.
Evaluacija: Preciznost pre svega
📊 U domenima za koje je optimizovana, Lana beleži preko 90% tačnosti odgovora.
To se odnosi na:
- generisanje tekstova
- sumiranje
- pisanje mejlova
- akademsku pomoć
- prevođenje i lokalizaciju
U nišama gde se koristi RAG, preciznost raste dodatno – jer koristi ažurirane informacije iz odvojenih baza, van svog “unutrašnjeg znanja”.
Zaključak: Nema gigantskog tima – ali ima dubinu
✅Lana nije razvijana u openAI laboratoriji, nema stotine GPU-ova, ali zato ima dubinu razumevanja, inteligentan dizajn i lokalni fokus.
Kao inženjer mogu reći – ono što je postignuto sa ograničenim resursima je tehnički impresivno, i predstavlja dokaz da AI tehnologija ne mora biti ekskluzivna privilegija globalnih giganata.
„Snaga lokalnog AI modela nije u njegovoj veličini, već u tome koliko dobro razume nas – naš jezik, potrebe i kulturu.“ – iz razvojne dokumentacije Lane
👉 Isprobaj Lanu već danas
📌 Poseti www.upoznajlanu.com i otkrij kako funkcioniše domaći AI asistent razvijen s vizijom i preciznošću.
U narednom blogu otkrićemo kako je to kada AI priča na tvom jeziku, zašto je to superiorno u razumevanju I rešavanju problema.
📢 Pratite “Svet IKT” za najnovije informacije o tehnološkim inovacijama! 🚀


Leave a comment