mediaTUM
Universitätsbibliothek
Technische Universität München
Benutzer: Gast
Login
de
en
mediaTUM Gesamtbestand
Hochschulbibliographie
2024
(5262)
Schools und Fakultäten
(4835)
TUM Campus Straubing für Biotechnologie und Nachhaltigkeit
(68)
TUM School of Computation, Information and Technology
(1003)
TUM School of Engineering and Design
(1590)
TUM School of Life Sciences
(721)
TUM School of Management
(207)
TUM School of Medicine and Health
(613)
Arbeitsbereich Sportpsychologie (Dr. Ehrlenspiel)
(10)
Arbeitsbereich für Medien und Kommunikation (Dr. Schaffrath)
(4)
Betriebseinheit Angewandte Sportwissenschaft (Dr. Spitzenpfeil)
(3)
Else Kröner-Fresenius-Zentrum für Ernährungsmedizin - Klinik für Ernährungsmedizin
(4)
Institut für Allgemeine Pathologie und Pathologische Anatomie
(21)
Institut für Allgemeinmedizin
(5)
Institut für Arbeitsmedizin - LMU
Institut für Experimentelle Hämatologie (Prof. Schmidt-Supprian)
(1)
Institut für Experimentelle Neuroimmunologie (Prof. Korn)
Institut für Experimentelle Tumortherapie (Prof. Saur)
(2)
Institut für Geschichte und Ethik der Medizin
(49)
Institut für Humangenetik
(12)
Institut für Klinische Chemie und Pathobiochemie
(9)
Institut für Medizinische Mikrobiologie, Immunologie und Hygiene
(5)
Institut für Medizinische Statistik und Epidemiologie
(42)
Institut für Molekulare Immunologie
(10)
Institut für Molekulare Onkologie und Funktionelle Genomik
(8)
Institut für Neurowissenschaften
(1)
Institut für Pharmakologie und Toxikologie
(2)
Institut für Radiologie
(158)
Institut für Rechtsmedizin - LMU
Institut für Toxikologie und Umwelthygiene
(10)
Institut für Virologie
(7)
Institut für Zellbiologie des Nervensystems
(2)
Lehrstuhl für Bewegungswissenschaft (Prof. Hermsdörfer)
(15)
Lehrstuhl für Epidemiologie (Prof. Klug)
(37)
Lehrstuhl für Präventive Pädiatrie (Prof. Oberhoffer-Fritz)
(6)
Lehrstuhl für Soziale Determinanten der Gesundheit (Prof. Richter)
(18)
Lehrstuhl für Sport- und Gesundheitsmanagement (Prof. Königstorfer)
(9)
Lehrstuhl für Trainingswissenschaft und Sportinformatik (N.N.)
(15)
Molekulare Allergologie
(17)
Professur für Behavioral Sciences in Prevention and Care (Prof. Sudharsanan)
Professur für Bewegung, Ernährung und Gesundheit (Prof. Köhler)
(27)
Professur für Biomechanik im Sport (Prof. Schwirtz)
(10)
Professur für Chronobiology & Health (Prof. Spitschan)
(2)
Professur für Gesundheitsökonomie (Prof. Sundmacher)
(18)
Professur für Health Literacy (Prof. Okan)
(6)
Professur für Konservative und Rehabilitative Orthopädie (Prof. Horstmann)
(19)
Professur für Neuromuskuläre Diagnostik (Prof. Franklin)
(4)
Professur für Psychology & Digital Mental Health Care (Prof. Ebert)
(23)
Professur für Public Health und Prevention (Prof. Laxy)
(11)
Professur für Sport- und Gesundheitsdidaktik (Prof. Mess)
(15)
Professur für Sport- und Gesundheitspädagogik (N.N.)
(1)
Professur für Sportbiologie (Prof. Wackerhage)
(11)
TUM School of Natural Sciences
(293)
TUM School of Social Sciences and Technology
(359)
Integrated Research Centers
(110)
Zentrale Einrichtungen
(317)
2023
(7955)
2022
(8729)
2021
(8937)
2020
(8190)
2019
(8865)
2018
(8662)
2017
(8686)
2016
(8831)
2015
(8220)
2014
(7148)
2013
(6755)
2012
(5774)
2011
(5563)
2010
(5427)
2009
(4595)
2008
(4109)
1989 - 2007
Elektronische Prüfungsarbeiten
Open Access Publikationen
Forschungsdaten
TUM.University Press
Sammlungen
Projekte
Einrichtungen
mediaTUM Gesamtbestand
Hochschulbibliographie
2024
Schools und Fakultäten
TUM School of Medicine and Health
Institut für Radiologie
Zurück
Zurück zum Anfang der Trefferliste
Dauerhafter Link zum angezeigten Objekt
Titel:
Comparing Commercial and Open-Source Large Language Models for Labeling Chest Radiograph Reports.
Dokumenttyp:
Journal Article; Comparative Study
Autor(en):
Dorfner, Felix J; Jürgensen, Liv; Donle, Leonhard; Al Mohamad, Fares; Bodenmann, Tobias R; Cleveland, Mason C; Busch, Felix; Adams, Lisa C; Sato, James; Schultz, Thomas; Kim, Albert E; Merkow, Jameson; Bressem, Keno K; Bridge, Christopher P
Abstract:
Background Rapid advances in large language models (LLMs) have led to the development of numerous commercial and open-source models. While recent publications have explored OpenAI's GPT-4 to extract information of interest from radiology reports, there has not been a real-world comparison of GPT-4 to leading open-source models. Purpose To compare different leading open-source LLMs to GPT-4 on the task of extracting relevant findings from chest radiograph reports. Materials and Methods Two independent datasets of free-text radiology reports from chest radiograph examinations were used in this retrospective study performed between February 2, 2024, and February 14, 2024. The first dataset consisted of reports from the ImaGenome dataset, providing reference standard annotations from the MIMIC-CXR database acquired between 2011 and 2016. The second dataset consisted of randomly selected reports created at the Massachusetts General Hospital between July 2019 and July 2021. In both datasets, the commercial models GPT-3.5 Turbo and GPT-4 were compared with open-source models that included Mistral-7B and Mixtral-8 × 7B (Mistral AI), Llama 2-13B and Llama 2-70B (Meta), and Qwen1.5-72B (Alibaba Group), as well as CheXbert and CheXpert-labeler (Stanford ML Group), in their ability to accurately label the presence of multiple findings in radiograph text reports using zero-shot and few-shot prompting. The McNemar test was used to compare F1 scores between models. Results On the ImaGenome dataset (n = 450), the open-source model with the highest score, Llama 2-70B, achieved micro F1 scores of 0.97 and 0.97 for zero-shot and few-shot prompting, respectively, compared with the GPT-4 F1 scores of 0.98 and 0.98 (P > .99 and < .001 for superiority of GPT-4). On the institutional dataset (n = 500), the open-source model with the highest score, an ensemble model, achieved micro F1 scores of 0.96 and 0.97 for zero-shot and few-shot prompting, respectively, compared with the GPT-4 F1 scores of 0.98 and 0.97 (P < .001 and > .99 for superiority of GPT-4). Conclusion Although GPT-4 was superior to open-source models in zero-shot report labeling, few-shot prompting with a small number of example reports closely matched the performance of GPT-4. The benefit of few-shot prompting varied across datasets and models. © RSNA, 2024 Supplemental material is available for this article.
Zeitschriftentitel:
Radiology
Jahr:
2024
Band / Volume:
313
Heft / Issue:
1
Volltext / DOI:
doi:10.1148/radiol.241139
PubMed:
http://view.ncbi.nlm.nih.gov/pubmed/39470431
Print-ISSN:
0033-8419
TUM Einrichtung:
Institut für Diagnostische und Interventionelle Radiologie (Prof. Makowski)
BibTeX
Vorkommen:
mediaTUM Gesamtbestand
Hochschulbibliographie
2024
Schools und Fakultäten
TUM School of Medicine and Health
Institut für Radiologie
mediaTUM Gesamtbestand
Einrichtungen
Schools
TUM School of Medicine and Health
Departments
Clinical Medicine
Institut für Diagnostische und Interventionelle Radiologie (Prof. Makowski)
2024