Liu F et al. (2025) Application of large language models in medicine. Nature Reviews Bioengineering 3

Liu F, Zhou H, Gu B et al. (2025) Application of large language models in medicine. Nature Reviews Bioengineering 3, 445–464 – https://doi.org/10.1038/s44222-025-00279-5

Abstract (povzetek):

Veliki jezikovni modeli (angl. Large language model – LLM), kot je ChatGPT, so pritegnili veliko pozornosti zaradi svojih sposobnosti razumevanja in ustvarjanja človeškega jezika. Kljub trendu raziskovanja uporabe velikih jezikovnih modelov pri podpori različnih medicinskih nalog (kot so izboljšanje klinične diagnostike in zagotavljanje medicinskega izobraževanja), še vedno ni celovite ocene njihovega razvoja, praktičnih uporab in rezultatov na medicinskem področju. Zato je cilj tega pregleda zagotoviti pregled razvoja in uporabe velikih jezikovnih modelov v medicini, vključno z izzivi in priložnostmi, s katerimi se soočajo. V smislu razvoja obravnavamo načela obstoječih medicinskih velikih jezikovnih modelov, vključno z njihovimi osnovnimi modelnimi strukturami, številom parametrov ter viri in obsegom podatkov, ki se uporabljajo za razvoj modelov. V smislu uporabe primerjamo različne velike jezikovne modele v različnih medicinskih nalogah in z najsodobnejšimi lahkimi modeli.

Key Points (ključne ugotovitve):

  • Obstoječi veliki jezikovni modeli za medicino, ki obsegajo od 110 milijonov do 520 milijard parametrov, so v glavnem razviti s pomočjo predhodnega usposabljanja, finega uravnavanja in spodbujanja z uporabo obsežnih medicinskih korpusov iz različnih virov.
  • Njihova učinkovitost se večinoma ocenjuje na podlagi nalog v obliki vprašanj in odgovorov, podobnih tistim na izpitih. Kombinacija različnih metod finega uravnavanja in spodbujanja omogoča velikim jezikovnim modelom doseganje primerljivih ali celo boljših rezultatov kot strokovnjaki.
  • Veliki jezikovni modeli slabo delujejo pri nalogah, ki ne vključujejo vprašanj in odgovorov brez vnaprej nastavljenih možnosti, zato so potrebne nadaljnje izboljšave, preden se jih lahko vključi v dejanske klinične procese odločanja.
  • Medicinski veliki jezikovni modeli se prilagajajo različnim kliničnim aplikacijam, vendar še vedno manjkajo obsežne klinične študije.
  • Zmanjšanje halucinacij, vzpostavitev zanesljivih podatkov, meril in kazalnikov ter obravnavanje etičnih, varnostnih in regulativnih vprašanj prek interdisciplinarnega sodelovanja bodo pomagali pospešiti integracijo velikih jezikovnih modelov v klinično prakso.

Povezave na velike jezikovne modele, ki se uporabljajo v medicinski praksi, in drugi relevatni viri za prispevek:

Alpaca: https://github.com/tatsu-lab/stanford_alpaca
Bard: https://gemini.google.com/
ChatGPT: https://chat.openai.com/
Claude-3: https://www.anthropic.com/news/claude-3-family
HealthcareMagic: https://www.healthcaremagic.com/
iCliniq: https://www.icliniq.com/
LLaMA-3: https://github.com/meta-llama/llama3
MedLlama3-v20: https://huggingface.co/ProbeMedicalYonseiMAILab/medllama3-v20
OpenBioLLM: https://huggingface.co/aaditya/OpenBioLLM-Llama3-70B
PubMed: https://pubmed.ncbi.nlm.nih.gov/
PubMed Central (PMC): https://www.ncbi.nlm.nih.gov/pmc/
ShareGPT: https://sharegpt.com/

URL: https://www.nature.com/articles/s44222-025-00279-5