Η Apple παρουσιάζει νέο εργαλείο Τεχνητής Νοημοσύνης για επεξεργασία εικόνας με χρήση κειμενικών οδηγιών



Τι πρέπει να ξέρετε

  • Οι ερευνητές της Apple παρουσίασαν ένα νέο εργαλείο εικόνας AI που επιτρέπει σ

    ς χρήστες να επεξεργάζονται εικόνες χρησιμοποιώντας μηνύματα κειμένου.
  • Το εργαλείο MLLM-Guided Image Editing (MGIE) μπορεί να αλλάξει το μέγεθος, να αναστρέψει, να περικόψει και ακόμη και να προσθέσει φίλτρα σε εικόνες μέσω μηνυμάτων κειμένου.
  • Μπορείτε να το κατεβάσετε στο GitHub, αν και η Apple δεν έχει δηλώσει κατηγορηματικά τα σχέδιά της για το μοντέλο.

Με την ταχεία υιοθέτηση της γενετικής τεχνολογίας AI, εργαλεία δημιουργίας εικόνων όπως το Image Creator της

από το Designer (πρώην Bing Image Creator), το Midjourney και άλλα αναδύονται όλο και περισσότερο. Ως άπληστος χρήστης αυτών των μοντέλων, βρίσκω ενοχλητικό το γεγονός ότι δεν υπάρχει γρήγορος τρόπος να επεξεργαστείτε μια εικόνα που έχετε ήδη δημιουργήσει.

Η Google βρίσκεται σε καλό δρόμο για να διορθώσει αυτό το πρόβλημα με το πειραματικό εργαλείο δημιουργίας εικόνων, ImageFX. Αυτό που το κάνει να ξεχωρίζει από το πλήθος είναι ότι πέρα ​​από τη δημιουργία εικόνων με χρήση προτροπών, επιτρέπει στους χρήστες να τροποποιούν τις προτροπές χρησιμοποιώντας εκφραστικά τσιπ, καθιστώντας έτσι ευκολότερο τον ακριβή συντονισμό της εξόδου.

Και τώρα, η Apple φαίνεται ότι έχει ενταχθεί στη μάχη

ένα νέο μοντέλο με τεχνητή νοημοσύνη που επιτρέπει στους χρήστες να περιγράφουν τις αλλαγές που θα ήθελαν να κάνουν σε μια φωτογραφία

χωρίς πλοήγηση στο λογισμικό. Το μοντέλο MLLM-Guided Image Editing (MGIE) μπορεί να αλλάξει το μέγεθος, να αναστρέψει, να περικόψει, ακόμη και να προσθέσει φίλτρα σε εικόνες μέσω μηνυμάτων κειμένου.

Το μοντέλο MGIE ερμηνεύει την προτροπή και μετά «φωτογραφίζει» τις αλλαγές που περιγράφει ο χρήστης πριν τις εφαρμόσει σε πραγματικό χρόνο. Στην ερευνητική εργασία, οι ερευνητές χρησιμοποίησαν μια φωτογραφία μιας πίτσας πεπερόνι και την προτροπή “κάντε την πιο υγιεινή” ως οδηγίες για τις αλλαγές που θα ήθελαν να εφαρμόσουν στη φωτογραφία. Κατά συνέπεια, το μοντέλο πρόσθεσε λαχανικά στην πίτσα πεπερόνι.

Σύμφωνα με τους ερευνητές:


“Αντί για σύντομη αλλά διφορούμενη καθοδήγηση, το MGIE αντλεί ρητή πρόθεση οπτικής επίγνωσης και οδηγεί σε λογική επεξεργασία εικόνας. Διεξάγουμε εκτενείς μελέτες από διάφορες πτυχές επεξεργασίας και αποδεικνύουμε ότι το MGIE βελτιώνει αποτελεσματικά την απόδοση διατηρώντας παράλληλα την ανταγωνιστική απόδοση. Πιστεύουμε επίσης ότι καθοδηγείται από το MLLM πλαίσιο μπορεί να συμβάλει στη μελλοντική έρευνα για το όραμα και τη γλώσσα».


Το νέο μοντέλο τεχνητής νοημοσύνης της Apple σάς επιτρέπει να κάνετε αλλαγές σε

χρησιμοποιώντας προτροπή


(Πίστωση εικόνας: Apple )

Είναι υπέροχο να βλέπεις ένα μοντέλο τεχνητής νοημοσύνης να διαθέτει αυτό το τόσο απαραίτητο χαρακτηριστικό που θα κάνει τη δημιουργία εικόνων ευκολότερη και ταχύτερη.

Τα deepfakes AI συνεχίζουν να αποτελούν πρόβλημα


(Εικόνα: Mikhail Parakhin στο Twitter)

Η δημιουργία εικόνων με χρήση τεχνητής νοημοσύνης είναι όλα διασκεδαστικά και παιχνίδια έως ότου οι άνθρωποι αρχίσουν να χρησιμοποιούν την τεχνολογία για να δημιουργούν ψεύτικες εικόνες και άσεμνο περιεχόμενο. Η ποπ σταρ

έγινε πρόσφατα πρωτοσέλιδο, αφού εμφανίστηκαν στα μέσα κοινωνικής δικτύωσης ξεκάθαρες εικόνες της, που πιστεύεται ότι δημιουργήθηκαν χρησιμοποιώντας το Microsoft Designer.

Αξίζει να σημειωθεί ότι το Microsoft Designer έχει ενημερωθεί με νέους κανονισμούς και προστατευτικά κιγκλιδώματα που εμποδίζουν τους χρήστες να δημιουργούν άσεμνο περιεχόμενο χρησιμοποιώντας το εργαλείο. Αυτό είναι πέρα ​​από τον πρόσφατα επιβληθέν νόμο Disrupt Explicit Forged Images and Non- Consensual Edits (DEFIANCE) που έχει σχεδιαστεί για να ρυθμίζει και να αποτρέπει τέτοια περιστατικά.

Ενώ τα προστατευτικά κιγκλιδώματα και η λογοκρισία μειώνουν σημαντικά τις πιθανότητες να συμβεί ξανά ένα τέτοιο περιστατικό, οι χρήστες παραπονέθηκαν ότι ορισμένα από αυτά τα μέτρα είναι υπερβολικά και φαινομενικά έχουν αφήσει εργαλεία όπως το Image Creator από το Designer να έχουν λοβοτομηθεί.

Στο παρελθόν, έχουμε δει πολλούς χρήστες να ξεγελούν τα chatbots AI για να κάνουν περιορισμένες εργασίες. Για παράδειγμα, όταν ένας χρήστης ξεγέλασε το ChatGPT για να δημιουργήσει κλειδιά των Windows. Επομένως, οι ερευνητές της Apple πρέπει να εξετάσουν αυτό το θέμα εκτενώς για να καλύψουν όλα τα κενά.

Παραμένει ασαφές ποια είναι τα σχέδια της Apple για το MGIE πέρα ​​από την έρευνα, αν και το μοντέλο είναι διαθέσιμο για λήψη στο GitHub. Η Apple ήταν σχετικά σιωπηλή στο τοπίο της τεχνητής νοημοσύνης, αλλά από την αρχή της χρονιάς, κάνει ανεπαίσθητα βήματα και ενισχύει την τεχνολογία. Από την άλλη πλευρά, η Microsoft βρίσκεται σε κορυφαία φόρμα, έχοντας πάρει από νωρίς το προβάδισμα στην τεχνητή νοημοσύνη κάνοντας μια επένδυση πολλών δισεκατομμυρίων δολαρίων, η οποία την έχει πλέον στην

της λίστας για την πιο πολύτιμη εταιρεία στον κόσμο.


VIA:

WindowsCentral


Follow TechWar.gr on Google News