NEWSLETTER

Page 46 - NEWSLETTER_27

P. 46

E.O.E Newsletter | www.huanet.gr
Η ΧΡΗΣΗ ΤΏΝ LARGE LANGUAGE MODELS (LLMS) ΣΤΗΝ ΙΑΤΡΙΚΗ ΚΑΙ ΤΟ CHATGPT
Είτε κάποιος είναι φιλικά προσκείμενος είτε πολέμιος της τεχνητής νοημοσύνης (ΤΝ) και των νέων τεχνολογιών, η σαρωτική εμφάνι- ση και ταχύτατη διάδοση του ChatGTP (Chat
Generative Pre-Trained Transformer) με 100 εκατομ- μύρια χρήστες ήδη τους 2 πρώτους μήνες από την ανακοίνωση του επιβάλει την εξοικείωση με αυτού του είδους την τεχνολογία. Ήδη 92% των Fortune 500 εταιρειών (οι κορυφαίες εταιρείες με έδρα στις Η.Π.Α. βάσει ετήσιων εσόδων) χρησι-
μοποιεί αυτή την τεχνολογία. Πώς λει-
τουργεί όμως ένα LLM και κατ’ επέκτα-
ση το ChatGPT? Είναι αλγόριθμοι ΤΝ
που χρησιμοποιούν τεχνικές βαθιάς
μάθησης (Deep Learning-DL) και big
data, ώστε να δημιουργηθεί κείμενο
που να προσομοιάζει σε ανθρώπινη
ομιλία ως απάντηση σε μία ερώτη-
ση (prompt). Η εκπαίδευση αυτών των
μοντέλων έγινε αρχικά με δεδομένα που
υπήρχαν στο διαδίκτυο (άρθρα, βιβλία, ανοι-
χτές βάσεις δεδομένων, forum κ.α.) ως το 2021 (για την έκδοση 3.5) και αναβαθμίστηκαν αργότερα με την υπό πληρωμή έκδοση 4.0, αλλά υπόκεινται σε διαρκή εκπαίδευση βάσει της αλληλεπίδρασης με τους χρή- στες. Όταν για πρώτη φορά δόθηκαν για ελεύθερη χρήση στο κοινό πριν από 12 μήνες, η εταιρεία (Open AI), επωφελήθηκε της περιέργειας των χρηστών ώστε να εκπαιδεύσει τους αλγορίθμους τάχιστα καθώς εκατομμύρια χρήστες θέτουν πολλαπλά ερωτήματα καθημερινά, συμβάλλοντας στην εκπαίδευση των μοντέλων. Η απάντηση δίνεται βάσει νευρωνικών δικτύων (neural networks), τα οποία προβλέπουν με πολύ ικανοποιητική ακρίβεια τις επόμενες λέξεις σε μία ακολουθία, ενώ αυτή η διαδικασία επαναλαμβά-
νεται μέχρι η απόδοση του μοντέλου να αξιολογηθεί ως ικανοποιητική. Τα LLMs προϋπήρχαν πριν από τον Ιανουάριο του 2023, οπότε και έγιναν ευρέως γνωστά, αλλά η απόδοση τους ‘’απογειώθηκε’’ τους τελευ- ταίους 12 μήνες με τα μοντέλα ChatGPT 3.5 και 4.0 της εταιρείας OpenAI, ενώ άλλα LLMs όπως το Bard (Google) είναι λιγότερο ανταγωνιστικά. Ποια η βασική διαφορά των μοντέλων 3.5 και 4? Αρχικά το νεότερο
μοντέλο απαιτεί μία συνδρομή, αλλά η εκπαί- δευση του πραγματοποιήθηκε με περίπου 1.76 τρισεκατομμύρια παραμέτρους, εν αντιθέσει του 3.5 που έγινε με 175 δισεκατομ- μύρια. Όσον αφορά τη μνήμη, το μοντέλο 4.0 μπορεί να φτάσει τις 64000 λέξεις, έναντι των 8000 της προηγούμενης έκδοσης, ενώ η αναβάθμιση στις διάφορες γλώσσες λειτουργίας ήταν επίσης εντυπωσιακή, καθώς από την Αγγλική του 3.5, το μο- ντέλο 4.0 λειτουργεί σε 25 ακόμα γλώσσες. Ένα πολύ βασικό στοιχείο αυτών των μοντέλων, είναι πως δε δημιουργήθηκαν αποκλειστικά για τη χρήση σε έναν επιστημονικό κλάδο (π.χ. Μαθηματικά, Ιατρική κ.α.), αλλά ως γενικά μοντέλα γλωσσικής επεξεργασίας, που με περαιτέρω εκπαίδευση επιτυγχάνουν θεαματι- κά αποτελέσματα στην πλειοψηφία των εργασιών που τους ανατίθενται; Για παράδειγμα, δημιουργούν έργα τέχνης, πραγματοποιούν σύνθετους μαθηματικούς υπολογισμούς, αναγνωρίζουν patterns σε εικόνες μαγνητικής τομογραφίας ή παθολογοανατομικών πα- ρασκευασμάτων και πολλά άλλα. Συγκεκριμένα όσον αφορά την Ιατρική και κατ’ επέκταση την Ουρολογία, το ChatGPT ήδη αναφέρεται σε μελέτες ως βοήθημα για την καθημερινή κλινική πρακτική, όπου μπορεί
46
ΑΡΘΡΟ

44 45 46 47 48