Autor: Aleksandar RadenkovićIKT inženjer i analitičar tehnologije

🧠Kada govorimo o velikim jezičkim modelima (LLM – Large Language Models), obično zamišljamo stotine inženjera, hiljade GPU-ova, ogromne korporacije i stotine miliona dolara. Lana AI, međutim, priča je druge vrste: LLM razvijen lokalno, bez institucionalne mašinerije, vođen znanjem, vizijom i upornošću pojedinca.

Zvuči kao mit? Vreme je da razložimo kakva je Lana “bez šminke”, da pokažemo da nije uvek veličina ono što odlučuje, već fokus, kontekst i optimizacija.


Od ideje do funkcionalnog modela – put od tri godine

💡Razvoj Lana AI-ja trajao je preko 3 godine, i to od strane jednog čoveka – Filipa Stefanovića.
U eri kada se AI modeli prave uz stotine developera i složene timove, Filip je demonstrirao da je ekspertiza, istrajnost i dobar dizajn ponekad snažnija valuta od budžeta.


Tehnologije u osnovi Lane

⚙️Lana nije fine-tuned verzija ChatGPT-a, LLaMA-e ili Mistrala. Ona je:

🔸 Custom jezički model (LLM) – treniran od nule
🔸 Zasnovan na Transformer arhitekturi – industrijski standard za razumevanje i generisanje jezika
🔸 Razvijen korišćenjem:

  • TensorFlow i JAX – za fleksibilno modelovanje i efikasno treniranje
  • TPU (Tensor Processing Units) – hardverski akceleratori Google-a, dizajnirani za treniranje ogromnih modela

🎯 U pitanju je domaći LLM zasnovan na otvorenim framework-ima, ali sa originalnim podešavanjima i arhitekturom.


Osnovni principi razvoja

1. Kvalitet i raznovrsnost trening podataka

🧱Lana je trenirana na visokokvalitetnim skupovima podataka, uz strogu kontrolu pristrasnosti i balansa. Fokus je bio na:

  • jeziku svakodnevnog čoveka
  • naučnim tekstovima
  • poslovnoj i obrazovnoj komunikaciji
  • kulturnim i lokalnim referencama (što globalni modeli često zanemaruju)

2. Specijalizovana skalabilna arhitektura

📚Dok neki modeli idu na “što više tokena, što više GPU-a”, Lana je:

  • pažljivo dimenzionisana
  • balansirana između računarske efikasnosti i jezičke preciznosti
  • dizajnirana za stabilnu inferenciju, uz prosečan latency od 0.5 do 2 sekunde

Ključni tehnički izazovi

🔬 U razvoju Lane, Filip se suočio sa izazovima koji su poznati i najvećim AI laboratorijama:

  1. Skaliranje modela – rad sa stotinama milijardi parametara zahteva ogromne resurse
  2. Halucinacije – borba protiv izmišljanja informacija, rešeno finim podešavanjima i prompt engineering-om
  3. Kontrola ponašanja (alignment) – da model ne bude samo tačan, već i koristan i bezbedan
  4. Evaluacija – razvijeni su sopstveni metrički sistemi za merenje: istinitosti, korisnosti, brzine i relevantnosti odgovora
  5. Kontekstualno razumevanje – Lana trenutno koristi kontekstualni kapacitet od 8k tokena, što joj omogućava da vodi koherentne, duže razgovore sa pamćenjem prethodnih poruka

Pristup inferenciji – efikasnost u oblaku

🧬Lana funkcioniše u cloud okruženju, koristeći visoko optimizovane servere. Iako lokalno hostovanje nije podrazumevano, moguće je za B2B partnere – čime se dobija fleksibilnost i kontrola nad podacima.

🚀 Inferencija se odvija brzo zahvaljujući:

  • optimalnom skaliranju modela
  • pažljivoj organizaciji servera
  • pametnom prefetchingu i token streamovanju

Personalizacija i fine-tuning

🔄Lana trenutno ne poseduje stalnu memoriju o korisnicima, ali se personalizuje pomoću:

  • prompt engineering-a: korisnik može zahtevati formalni ton, kreativni stil, ekspertsku perspektivu…
  • fine-tuning-a na specifičnim domenima: što omogućava da bude posebno efikasna u edukaciji, korisničkoj podršci, prevođenju itd.
  • RAG (Retrieval-Augmented Generation): omogućava joj da koristi spoljne baze znanja tokom razgovora

📌 Zahvaljujući ovim tehnikama, Lana ne nudi samo generisanje – ona se prilagođava svrsi, u realnom vremenu.


Evaluacija: Preciznost pre svega

📊 U domenima za koje je optimizovana, Lana beleži preko 90% tačnosti odgovora.
To se odnosi na:

  • generisanje tekstova
  • sumiranje
  • pisanje mejlova
  • akademsku pomoć
  • prevođenje i lokalizaciju

U nišama gde se koristi RAG, preciznost raste dodatno – jer koristi ažurirane informacije iz odvojenih baza, van svog “unutrašnjeg znanja”.


Zaključak: Nema gigantskog tima – ali ima dubinu

✅Lana nije razvijana u openAI laboratoriji, nema stotine GPU-ova, ali zato ima dubinu razumevanja, inteligentan dizajn i lokalni fokus.

Kao inženjer mogu reći – ono što je postignuto sa ograničenim resursima je tehnički impresivno, i predstavlja dokaz da AI tehnologija ne mora biti ekskluzivna privilegija globalnih giganata.

„Snaga lokalnog AI modela nije u njegovoj veličini, već u tome koliko dobro razume nas – naš jezik, potrebe i kulturu.“ – iz razvojne dokumentacije Lane


👉 Isprobaj Lanu već danas

📌 Poseti www.upoznajlanu.com i otkrij kako funkcioniše domaći AI asistent razvijen s vizijom i preciznošću.

U narednom blogu otkrićemo kako je to kada AI priča na tvom jeziku, zašto je to superiorno u razumevanju I rešavanju problema.

📢 Pratite “Svet IKT” za najnovije informacije o tehnološkim inovacijama! 🚀

Leave a comment

Citat nedelje

Da, istina je da ja uvek preduzmem više nego što mogu da ostvarim.

~ Nikola Tesla

Designed by ARVexus Solution