Page 46 - NEWSLETTER_27
P. 46

 E.O.E Newsletter | www.huanet.gr
 Η ΧΡΗΣΗ ΤΏΝ LARGE LANGUAGE MODELS (LLMS) ΣΤΗΝ ΙΑΤΡΙΚΗ ΚΑΙ ΤΟ CHATGPT
Είτε κάποιος είναι φιλικά προσκείμενος είτε πολέμιος της τεχνητής νοημοσύνης (ΤΝ) και των νέων τεχνολογιών, η σαρωτική εμφάνι- ση και ταχύτατη διάδοση του ChatGTP (Chat
Generative Pre-Trained Transformer) με 100 εκατομ- μύρια χρήστες ήδη τους 2 πρώτους μήνες από την ανακοίνωση του επιβάλει την εξοικείωση με αυτού του είδους την τεχνολογία. Ήδη 92% των Fortune 500 εταιρειών (οι κορυφαίες εταιρείες με έδρα στις Η.Π.Α. βάσει ετήσιων εσόδων) χρησι-
μοποιεί αυτή την τεχνολογία. Πώς λει-
τουργεί όμως ένα LLM και κατ’ επέκτα-
ση το ChatGPT? Είναι αλγόριθμοι ΤΝ
που χρησιμοποιούν τεχνικές βαθιάς
μάθησης (Deep Learning-DL) και big
data, ώστε να δημιουργηθεί κείμενο
που να προσομοιάζει σε ανθρώπινη
ομιλία ως απάντηση σε μία ερώτη-
ση (prompt). Η εκπαίδευση αυτών των
μοντέλων έγινε αρχικά με δεδομένα που
υπήρχαν στο διαδίκτυο (άρθρα, βιβλία, ανοι-
χτές βάσεις δεδομένων, forum κ.α.) ως το 2021 (για την έκδοση 3.5) και αναβαθμίστηκαν αργότερα με την υπό πληρωμή έκδοση 4.0, αλλά υπόκεινται σε διαρκή εκπαίδευση βάσει της αλληλεπίδρασης με τους χρή- στες. Όταν για πρώτη φορά δόθηκαν για ελεύθερη χρήση στο κοινό πριν από 12 μήνες, η εταιρεία (Open AI), επωφελήθηκε της περιέργειας των χρηστών ώστε να εκπαιδεύσει τους αλγορίθμους τάχιστα καθώς εκατομμύρια χρήστες θέτουν πολλαπλά ερωτήματα καθημερινά, συμβάλλοντας στην εκπαίδευση των μοντέλων. Η απάντηση δίνεται βάσει νευρωνικών δικτύων (neural networks), τα οποία προβλέπουν με πολύ ικανοποιητική ακρίβεια τις επόμενες λέξεις σε μία ακολουθία, ενώ αυτή η διαδικασία επαναλαμβά-
νεται μέχρι η απόδοση του μοντέλου να αξιολογηθεί ως ικανοποιητική. Τα LLMs προϋπήρχαν πριν από τον Ιανουάριο του 2023, οπότε και έγιναν ευρέως γνωστά, αλλά η απόδοση τους ‘’απογειώθηκε’’ τους τελευ- ταίους 12 μήνες με τα μοντέλα ChatGPT 3.5 και 4.0 της εταιρείας OpenAI, ενώ άλλα LLMs όπως το Bard (Google) είναι λιγότερο ανταγωνιστικά. Ποια η βασική διαφορά των μοντέλων 3.5 και 4? Αρχικά το νεότερο
μοντέλο απαιτεί μία συνδρομή, αλλά η εκπαί- δευση του πραγματοποιήθηκε με περίπου 1.76 τρισεκατομμύρια παραμέτρους, εν αντιθέσει του 3.5 που έγινε με 175 δισεκατομ- μύρια. Όσον αφορά τη μνήμη, το μοντέλο 4.0 μπορεί να φτάσει τις 64000 λέξεις, έναντι των 8000 της προηγούμενης έκδοσης, ενώ η αναβάθμιση στις διάφορες γλώσσες λειτουργίας ήταν επίσης εντυπωσιακή, καθώς από την Αγγλική του 3.5, το μο- ντέλο 4.0 λειτουργεί σε 25 ακόμα γλώσσες. Ένα πολύ βασικό στοιχείο αυτών των μοντέλων, είναι πως δε δημιουργήθηκαν αποκλειστικά για τη χρήση σε έναν επιστημονικό κλάδο (π.χ. Μαθηματικά, Ιατρική κ.α.), αλλά ως γενικά μοντέλα γλωσσικής επεξεργασίας, που με περαιτέρω εκπαίδευση επιτυγχάνουν θεαματι- κά αποτελέσματα στην πλειοψηφία των εργασιών που τους ανατίθενται; Για παράδειγμα, δημιουργούν έργα τέχνης, πραγματοποιούν σύνθετους μαθηματικούς υπολογισμούς, αναγνωρίζουν patterns σε εικόνες μαγνητικής τομογραφίας ή παθολογοανατομικών πα- ρασκευασμάτων και πολλά άλλα. Συγκεκριμένα όσον αφορά την Ιατρική και κατ’ επέκταση την Ουρολογία, το ChatGPT ήδη αναφέρεται σε μελέτες ως βοήθημα για την καθημερινή κλινική πρακτική, όπου μπορεί
   46
 ΑΡΘΡΟ
 














































































   44   45   46   47   48