Ένας οδηγός για την πλατφόρμα κειμένου σε εικόνα AI

By

Marizas Dimitris

On

Σεπ 29, 2023

Ο κόσμος της δημιουργίας τεχνητής νοημοσύνης φαίνεται σαν να έχει προχωρήσει δεκαετίες προς τα εμπρός μέσα σε λίγα μόνο χρόνια λόγω εργαλείων όπως το ChatGPT και το Midjourney. Ωστόσο, αυτές οι φιλικές προς το χρήστη εφαρμογές έχουν μακροπρόθεσμα θεμέλια στην τεχνολογία και την έρευνα που συντάχθηκαν προσεκτικά από τους

προγραμματιστές

με την πάροδο του χρόνου. Αυτό αποφέρει απίστευτα κόλπα, είτε πρόκειται για το ChatGPT που μιμείται έναν πρόεδρο είτε το Midjourney δημιουργεί σουρεαλιστικά έργα τέχνης.

Ένα ισχυρό παράδειγμα αυτών των τεχνολογιών, και ένας τρέχων ανταγωνιστής του Midjourney, ονομάζεται Stable Diffusion. Είναι μια γεννήτρια εικόνων που είναι αρκετά ελαφριά ώστε να χωράει στο smartphone σας με ένα single

λήψη εφαρμογής

αλλά τροφοδοτείται από περίπλοκη τεχνολογία AI. Εδώ είναι όλα όσα πρέπει να γνωρίζετε για αυτό.

Τι είναι η Σταθερή Διάχυση;

Είναι ένα μοντέλο τεχνητής νοημοσύνης βαθιάς εκμάθησης που μετατρέπει το κείμενο σε εικόνες. Με άλλα λόγια, πληκτρολογείτε μια περιγραφή όπως “ζωγραφική 4K γάτας που φοράει σμόκιν που σερβίρει κολίβρια σε κομψά γυαλιά κινηματογραφικό στυλ” και η Stable Diffusion κάνει ό,τι καλύτερο μπορεί για να δημιουργήσει μια εικόνα με βάση τις απαιτήσεις σας. Όσο περισσότερο κείμενο και λεπτομέρειες παρέχετε ή τροποποιείτε, τόσο πιο ακριβής είναι η Σταθερή Διάχυση μπορεί να δημιουργήσει μια εικόνα. Μια ποικιλία από γεννήτριες εικόνας, όπως το Dreamer, χρησιμοποιούν το μοντέλο Stable Diffusion. Είναι ιδιαίτερα καλό στην απόδοση ρεαλιστικών προσώπων και εικόνων (το παραπάνω παράδειγμά μας θέτει ορισμένα προβλήματα για το Stable Diffusion λόγω της αόριστης φύσης του).

Όπως και άλλα μοντέλα τεχνητής νοημοσύνης με εστίαση στην εικόνα, το Stable Diffusion κάνει μεγάλο μέρος της δουλειάς του αναλύοντας προσεκτικά έναν εντυπωσιακό αριθμό εικόνων και ερμηνεύοντας αυτές τις οπτικές πληροφορίες ως δεδομένα που μπορεί να χρησιμοποιήσει. Ωστόσο, μερικά πράγματα κάνουν το Stable Diffusion διαφορετικό. Πρώτον, οι προγραμματιστές του

το προσφέρετε ως SDXL

, μια έκδοση ανοιχτού κώδικα που μπορεί να χρησιμοποιήσει ο καθένας, με μεγαλύτερη δυνατότητα να τροποποιήσει το μοντέλο και γενικά να κρυφοκοιτάξει κάτω από το καπό. Δεύτερον, έχει σχεδιαστεί για να είναι ανώνυμο και ιδιωτικό για χρήση από την αρχή.

Και

για να μιλήσουμε για το τρίτο πράγμα, πρέπει να κάνουμε μια βαθύτερη κατάδυση τεχνολογίας.

Από πού προέρχεται το όνομα Stable Diffusion;

Το Stable Diffusion ονομάζεται έτσι επειδή είναι ένα μοντέλο λανθάνουσας διάχυσης. Ένα μοντέλο διάχυσης είναι ένας τύπος παραγωγικού μοντέλου που είναι εκπαιδευμένο να παράγει υλικό. Σε αυτή την περίπτωση, εικόνες. Είναι γνωστό ως διάχυση επειδή το μαθηματικό μοντέλο προσθέτει λάθη ή «θόρυβο» στις προπονητικές εικόνες για να κάνει δυσκολότερο να τα αναγνωρίσει σωστά η τεχνητή νοημοσύνη. Η εικόνα τελικά διαχέεται σε θόρυβο χωρίς νόημα, παρόμοιο με τον τρόπο που ένας κύβος ζάχαρης διαχέεται σε ένα ποτήρι τσάι. Αλλά στην πορεία, η τεχνητή νοημοσύνη μαθαίνει πώς να αναγνωρίζει εικόνες με τον ελάχιστο δυνατό αριθμό ενδείξεων και τελικά να αποκαθιστά ή να δημιουργεί δικές της εικόνες.

Το “λανθάνον” μέρος αυτού του μοντέλου διάχυσης σημαίνει ότι οι εικόνες που αναλύει η σταθερή διάχυση συμπιέζονται πρώτα σε διαφορετική μορφή δεδομένων. Αυτό σημαίνει ότι το Stable Diffusion δεν εξετάζει τις εικόνες pixel προς pixel. Αντίθετα, τα συμπιέζει σε αριθμούς που αντιπροσωπεύουν δεδομένα εικόνας και συμπιέζει αυτούς τους αριθμούς. Αυτό εξοικονομεί απίστευτο χώρο, οπότε το Stable Diffusion λειτουργεί πιο αποτελεσματικά.

Πώς ξεκίνησε για πρώτη φορά το Stable Diffusion;

Ενώ το Stable Diffusion είδε την ευρεία κυκλοφορία του το 2022, ήταν ένα έργο για πολλά χρόνια πριν από αυτό. Το μοντέλο τεχνητής νοημοσύνης ξεκίνησε ως ένα έργο μεταξύ του Πανεπιστημίου του Μονάχου, του Runway και του Ομίλου CompVis, που τροφοδοτήθηκε από χρηματοδότηση από διάφορους άλλους οργανισμούς. Το έργο Stability AI είχε τον πρώτο επίσημο γύρο χρηματοδότησης στα τέλη του 2022.

Μπορεί το Stable Diffusion να έχει πρόσβαση σε οποιοδήποτε έργο τέχνης στο διαδίκτυο για ανάλυση;

Ναί. Η εκπαίδευση Stable Diffusion βασίζεται στον μη κερδοσκοπικό ανιχνευτή LAION 5b, το εργαλείο που χρησιμοποιείται για τη συλλογή εικόνων για ανάλυση. Αυτός ο ανιχνευτής συλλαμβάνει εικόνες από κάθε είδους πηγές. Οι καλλιτέχνες δεν μπορούν να συμφωνήσουν να συμμετάσχουν στο πρόγραμμα ή να εμποδίσουν τη χρήση της δουλειάς τους για την εκπαίδευση του Stable Diffusion. Δεν είναι όλοι εντάξει με αυτό. Το 2023, τρεις καλλιτέχνες ενώθηκαν για να μηνύσουν τον οργανισμό για παραβίαση πνευματικών δικαιωμάτων, αν και αυτή η υπόθεση είναι ακόμη σε εξέλιξη.

Είναι το Stable Diffusion δωρεάν στη χρήση;

Το Stable Diffusion διατίθεται σε διάφορες μορφές και οι περισσότερες είναι δωρεάν στη χρήση χάρη στη φύση ανοιχτού κώδικα του λογισμικού. Μπορείτε να ξεκινήσετε με

την εφαρμογή Dreamer

ή το πιο συγκεντρωμένο

Anime Master

που χρησιμοποιεί επίσης την τεχνολογία. Ο ιστότοπος Stable Diffusion διαθέτει επίσης μια premium

συνδρομή

για πρόσβαση σε περισσότερες δυνατότητες.

Μπορούν οι άνθρωποι να χρησιμοποιήσουν το Stable Diffusion για να δημιουργήσουν

deepfakes

;

, Ένας οδηγός για την πλατφόρμα κειμένου σε εικόνα AI, TechWar.gr

Το Stable Diffusion είναι ιδιαίτερα καλό στην απόδοση προσώπων και παρόμοιων προσωποκεντρικών λεπτομερειών. Αυτό αυξάνει τον κίνδυνο deepfakes ή ψεύτικων εικόνων που δημιουργούνται για να ξεγελάσουν τους ανθρώπους να πιστεύουν ότι είναι αληθινοί άνθρωποι που κάνουν αληθινά πράγματα. Τα Deepfakes αποτελούν αντικείμενο βαθιάς υποψίας λόγω της πιθανότητας εκβιασμού,

παραπληροφόρηση

ς, προπαγάνδας και άλλων προβλημάτων.

Δεν είμαστε ακόμα σίγουροι πώς θα επιλυθούν τα ζητήματα πίσω από τα deepfakes, αλλά οι σημερινές συσκευές παραγωγής εικόνων που είναι εύκολα προσβάσιμες στο διαδίκτυο δεν είναι αρκετά καλές για να παράγουν χρησιμοποιήσιμα deepfakes. Η σταθερή διάχυση μπορεί να πλησιάσει στις σωστές συνθήκες, γεγονός που προκαλεί κάποια ανησυχία.

Οι εταιρείες είναι πιο πιθανό να χρησιμοποιούν Stable Diffusion

να δημιουργήσει ψεύτικους ανθρώπους για χρήσεις μάρκετινγκ, αλλά είναι ένα κουτάκι σκουληκιών που μόλις ανοίχτηκε. Το Stable Diffusion χρησιμοποιεί μια σιωπηρή άδεια τεχνητής νοημοσύνης που απαγορεύει τη χρήση δημιουργημένων εικόνων για διακρίσεις, εγκλήματα ή βλάβες για να αποτρέψει μελλοντικές απόπειρες deepfake.

Παραγωγή εικόνας με σταθερή διάχυση

Τώρα γνωρίζετε τα βασικά πίσω από το Stable Diffusion και τις δυνάμεις του στη δημιουργία εικόνας. Αν έχεις ένα λεπτό,

μπορείτε να επισκεφτείτε τον ιστότοπο

και γράψτε μια δική σας προτροπή. Σε αντίθεση με ορισμένες γεννήτριες, το Stable Diffusion σάς επιτρέπει να επιλέξετε από συγκεκριμένα στυλ και να τροποποιήσετε τις παραμέτρους του AI, επομένως είναι ένα καλό εργαλείο εισαγωγής για όσους θέλουν να μάθουν. Μπορεί επίσης να θέλετε να δείτε τον οδηγό μας για τον τρόπο αναγνώρισης εικόνων που δημιουργούνται από AI, μια ολοένα και πιο σημαντική δεξιότητα στον σημερινό διαδικτυακό κόσμο.

androidpolice.com

Παρόμοια άρθρα