Το ‘Animate Anyone’ προαναγγέλλει την προσέγγιση των deepfakes full-motion



Σαν να μην είναι αρκετά κακά τα deepfakes ακίνητων εικόνων, μπορεί σύντομα να χρειαστεί να αν

μετωπίσουμε τα δημιουργημένα βίντεο οποιουδήποτε τολμήσει να βάλει μια φωτογραφία του στο διαδίκτυο: με

Ζωντανέψτε οποιονδήποτε

οι κακοί ηθοποιοί μπορούν να κάνουν τους ανθρώπους καλύτερα από ποτέ.

Η νέα τεχνική του γενετικού βίντεο αναπτύχθηκε από ερευνητές στο Ινστιτούτο Ευφυών Υπολογιστών του Ομίλου

. Είναι ένα μεγάλο βήμα προς τα εμπρός από τα προηγούμενα συστήματα εικόνας σε βίντεο, όπως το Disco και το DreamPose, τα οποία ήταν εντυπωσιακά το

, αλλά αποτελούν πλέον αρχαία ιστορία.

Αυτό που μπορεί να κάνει το Animate Anyone δεν είναι σε καμία περίπτωση πρωτόγνωρο, αλλά έχει περάσει αυτό το δύσκολο διάστημα ανάμεσα στο «πανταχού ακαδημαϊκό πείραμα» και το «αρκετά καλό αν δεν κοιτάξετε προσεκτικά». Όπως όλοι γνωρίζουμε, το επόμενο στάδιο είναι απλά «αρκετά καλό», όπου οι άνθρωποι δεν θα μπουν καν στον κόπο να κοιτάξουν προσεκτικά επειδή υποθέτουν ότι είναι πραγματικό. Εκεί βρίσκονται επί του παρόντος οι ακίνητες εικόνες και η συνομιλία κειμένου, που προκαλούν όλεθρο στην αίσθηση της πραγματικότητας.

Τα μοντέλα εικόνας σε βίντεο όπως αυτό ξεκινούν εξάγοντας λεπτομέρειες, όπως χαρακτηριστικά προσώπου, σχέδια και πόζα, από μια εικόνα αναφοράς όπως μια φωτογραφία μόδας ενός μοντέλου που φορά ένα φόρεμα προς πώληση. Στη συνέχεια δημιουργείται μια σειρά εικόνων όπου αυτές οι λεπτομέρειες αντιστοιχίζονται σε πολύ ελαφρώς διαφορετικές σ

, οι οποίες μπορούν να αποτυπωθούν με κίνηση ή να εξαχθούν οι ίδιες από ένα άλλο βίντεο.

Τα προηγούμενα μοντέλα έδειχναν ότι αυτό ήταν δυνατό να γίνει, αλλά υπήρχαν πολλά προβλήματα. Η ψευδαίσθηση ήταν ένα μεγάλο πρόβλημα, καθώς το μοντέλο πρέπει να εφεύρει εύλογες λεπτομέρειες όπως το πώς μπορεί να κινείται ένα μανίκι ή μια τρίχα όταν ένα άτομο γυρίζει. Αυτό οδηγεί σε πολλές πραγματικά περίεργες εικόνες, καθιστώντας το βίντεο που προκύπτει κάθε άλλο παρά πειστικό. Αλλά η πιθανότητα παρέμεινε και το Animate Anyone είναι πολύ βελτιωμένο, αν και απέχει πολύ από το τέλειο.

Οι τεχνικές

του νέου μοντέλου ξεπερνούν τα περισσότερα, αλλά το

χαρτί

τονίζει ένα νέο ενδιάμεσο βήμα που «επιτρέπει στο μοντέλο να μάθει ολοκληρωμένα τη σχέση με την εικόνα αναφοράς σε έναν συνεπή χώρο χαρακτηριστικών, το οποίο συμβάλλει σημαντικά στη βελτίωση της διατήρησης των λεπτομερειών εμφάνισης». Βελτιώνοντας τη διατήρηση βασικών και λεπτών λεπτομερειών, οι εικόνες που δημιουργούνται στη γραμμή έχουν μια ισχυρότερη βασική αλήθεια για να δουλέψουν και αποδεικνύονται πολύ καλύτερες.


Συντελεστές εικόνας:

Alibaba Group

Επιδεικνύουν τα αποτελέσματά τους σε μερικά πλαίσια. Τα μοντέλα μόδας παίρνουν αυθαίρετες πόζες χωρίς να παραμορφώνονται ή το ρούχο να χάνει το μοτίβο του. Μια 2D φιγούρα anime ζωντανεύει και χορεύει πειστικά. Ο Λιονέλ Μέσι κάνει μερικές γενικές κινήσεις.

Απέχουν πολύ από το να είναι τέλεια — ειδικά για τα μάτια και τα χέρια, που δημιουργούν ιδιαίτερο πρόβλημα για τα μοντέλα παραγωγής. Και οι στάσεις που αναπαριστώνται καλύτερα είναι αυτές που βρίσκονται πιο κοντά στην αρχική. αν το άτομο γυρίσει, για παράδειγμα, το μοντέλο παλεύει να συμβαδίσει. Αλλά είναι ένα τεράστιο άλμα σε σχέση με την προηγούμενη κατάσταση της τέχνης, που παρήγαγε πολύ περισσότερα τεχνουργήματα ή έχασε εντελώς σημαντικές λεπτομέρειες όπως το χρώμα των μαλλιών ή τα ρούχα ενός ατόμου.

Είναι ανησυχητικό να πιστεύεις ότι, δεδομένης μιας εικόνας σου καλής ποιότητας, ένας κακόβουλος ηθοποιός (ή παραγωγός) θα μπορούσε να σε κάνει να κάνεις σχεδόν τα πάντα και σε συνδυασμό με κινούμενα σχέδια προσώπου και τεχνολογία λήψης φωνής, θα μπορούσαν επίσης να σε κάνουν να εκφράσεις οτιδήποτε ταυτόχρονα . Προς το παρόν, η τεχνολογία είναι πολύ περίπλοκη και με λάθη για γενική χρήση, αλλά τα πράγματα δεν τείνουν να παραμείνουν έτσι για πολύ στον κόσμο της τεχνητής νοημοσύνης.

Τουλάχιστον η ομάδα δεν έχει εξαπολύσει ακόμα τον κώδικα στον κόσμο. Αν και έχουν α

Σελίδα GitHub

, γράφουν οι προγραμματιστές: «εργαζόμαστε ενεργά για την προετοιμασία του demo και του κώδικα για δημόσια κυκλοφορία. Αν και δεν μπορούμε να δεσμευτούμε για μια συγκεκριμένη ημερομηνία κυκλοφορίας αυτή τη στιγμή, να είστε βέβαιοι ότι η πρόθεση να παρέχουμε πρόσβαση τόσο στο demo όσο και στον πηγαίο κώδικα είναι σταθερή.”

Θα σκάσει όλη η κόλαση όταν ξαφνικά το διαδίκτυο πλημμυρίσει από χορευτικά; Θα το μάθουμε και μάλλον νωρίτερα από όσο θα θέλαμε.


VIA:

techcrunch.com


Leave A Reply



Cancel Reply

Your email address will not be published.