Unicode: Πίσω από την κουρτίνα

Η κοινοπραξία Unicode γιόρτασε την 25η επέτειό της πέρυσι. Η αλήθεια είναι ότι παρά το γεγονός ότι η Unicode κάνει το Unicode για να εξασφαλίσει κείμενο από γλώσσες σε όλο τον κόσμο – οι περισσότεροι από εμάς γνωρίζουν το Unicode ως ομάδα που εγκρίνει νέα emojis.
Αυτό που μπορεί να μην είναι τόσο σαφές είναι ο λόγος για τον οποίο απαιτείται μια μεγάλη κοινοπραξία ή η κρυμμένη πολυπλοκότητα του Unicode. Ή πώς το εμετό emojis που εμφανίζεται στο κινούμενο σχέδιο XCKD παραπάνω θεωρείται ήδη “έγκυρο (αλλά δεν συνιστάται)”.

Ο Mark Davis, συνιδρυτής και πρόεδρος της Unicode, προσπάθησε να διευκρινίσει τον τρόπο με τον οποίο ο Emoji ταιριάζει στο Unicode σε αυτή την επισκόπηση υψηλού επιπέδου που εξετάζει το Unicode και πώς ταιριάζει η υποεπιτροπή του Unicode Emoji (“Emoji SC”) το.
Ο Ντέιβις σημειώνει ότι τα emojis αποτελούν μόνο ένα κλάσμα του συνολικού αριθμού των χαρακτήρων στο πρότυπο Unicode. Μπορείς να τους φτιάξεις μόλις σε αυτό το γράφημα:

Μόνο οι χαρακτήρες δεν λένε τη μισή ιστορία. Ορισμένοι glyphs πρέπει να συνδυάζονται όταν εμφανίζονται σε ορισμένες παραγγελίες ή συνδυασμούς.

Ένας συνδυασμός που θα είναι εξοικειωμένος με πολλούς είναι ο τρόπος με τον οποίο εφαρμόζονται οι αποχρώσεις του δέρματος emoji.
Αυτά λειτουργούν ανιχνεύοντας όταν εμφανίζεται ένας χαρακτήρας τροποποιητή μετά από ανθρώπινο emoji, όπως το 👧 κορίτσι. Αυτά συνδυάζονται σε υποστηριζόμενες πλατφόρμες για να δείξουν ένα μόνο emoji:

Μια πιο περίπλοκη εφαρμογή περιλαμβάνει τη συμμετοχή σε δύο ή περισσότερα emojis μαζί σε αυτό που ονομάζεται Emoji ZWJ ακολουθία.
Αυτά χρησιμοποιούνται για τη δημιουργία επαγγελμάτων όπως ο 👩‍⚖ill Woman Just. Αυτό το emoji δημιουργείται χρησιμοποιώντας τη γυναίκα 👩 👩 ⚖ ⚖od Emojis Scale Emojis.
Ένας χαρακτήρας “zwj” (μηδενικό πλάτος) βρίσκεται ανάμεσα σε αυτά τα δύο emojis και είναι μια αόρατη κόλλα που ενώνει πολλαπλά emojis σε ένα (όπου υποστηρίζεται).

Άλλοι τύποι ακολουθιών ZWJ απαριθμούν ένα υπάρχον emoji όπως 🕵ill ντετέκτιβ με ένα σύμβολο φύλου ♀️ θηλυκό σημάδι που προστέθηκε μετά από αυτό.
Αυτός ο τύπος ακολουθίας ZWJ χρησιμοποιείται γενικά εάν υπάρχει ήδη ένα emoji. Για παράδειγμα: Runner, Surfer ή πολλές από τις χειρονομίες.

Και ναι, μπορείτε να συνδυάσετε τροποποιητές και ZWJs για να δημιουργήσετε μια μακρύτερη ακολουθία.

Το Unicode δεν ελέγχει τις ακολουθίες ZWJ με τον ίδιο τρόπο όπως τα νέα emojis που απαιτούν το δικό τους σημείο κώδικα.
Οι συνιστώμενες ακολουθίες Unicode που πρέπει να υποστηρίζονται για τη συνοχή των πλατφορμών. Ωστόσο, οι πωλητές είναι ελεύθεροι να συνδυάσουν οποιοδήποτε emoji με οποιοδήποτε άλλο, όπως κρίνουν κατάλληλο.
Η Microsoft διαθέτει έξι γάτες ninja διαθέσιμες στα Windows, τα οποία δεν αποτελούν μέρος της συνιστώμενης λίστας της Unicode. 🐱 Το πρόσωπο της γάτας και ο 🚀 rocket συνδυάζονται στα Windows 10 για να δείξουν ένα emoji για 🐱‍🚀 Astro Cat.
Η Astro Cat είναι έγκυρη (καθώς χρησιμοποιεί μια σωστή δομή ακολουθίας), αλλά δεν συνιστάται όπως και άλλα επαγγέλματα και τα φύλα.

Το XKCD πρότεινε ότι ο εμετός θα πρέπει να είναι ένας χαρακτήρας τροποποιητή για να κάνει έναν “εμετό καουμπόη”.
Ο Davis επισημαίνει ότι το 🤠 καπέλο Cowboy θα μπορούσε ήδη να συνδυαστεί με εμετό προσώπου για να δημιουργήσει μια έγκυρη ακολουθία ZWJ:

Υπάρχουν άλλοι τύποι ακολουθιών για το emoji, συμπεριλαμβανομένων των ακολουθιών σημαίας, των ακολουθιών ετικετών και των αλληλουχιών KeyCap. Θα πρέπει να ελέγξετε ολόκληρο το σύνολο των διαφανειών για να τα δείτε λεπτομερέστερα.
Τέλος, μια ματιά στο χρονοδιάγραμμα (τρέχον, 2017) για το πώς γεννιέται ένα νέο emoji:

🚨 Ενημέρωση Απρίλιος 2020: Το τρέχον χρονοδιάγραμμα για το πώς δημιουργείται ένα νέο emoji έχει επηρεαστεί σημαντικά από την πανδημία Covid-19. Μπορείτε να διαβάσετε περισσότερα για το αναθεωρημένο πρόγραμμα για το 2020 και πέρα ​​εδώ.
Φυσικά η Unicode έχει ακόμα πολλά να κάνει έξω από την υποστήριξη του emoji:

“Υπάρχουν περίπου 7.000 ζωντανές ανθρώπινες γλώσσες, με ποικίλα επίπεδα ζωτικότητας. Λιγότερο από 100 από αυτές τις γλώσσες υποστηρίζονται καλά σε υπολογιστές, κινητά τηλέφωνα και άλλες συσκευές, ενώ όλοι οι υπόλοιποι κινδυνεύουν να είναι ψηφιακά μειονεκτούντες”

Το Unicode έχει ένα πρόγραμμα χαρακτήρων. Τα κεφάλαια που αντλήθηκαν από τις υιοθεσίες πηγαίνουν προς την έρευνα για να υποστηρίξουν αυτές τις ψηφιακά μειονεκτούσες γλώσσες.
Περισσότερο:

Unicode Emoji από τον Mark Davis
Unicode υιοθετήστε έναν χαρακτήρα
Νέο emojis για το 2017
Διασκέδαση Emoji Hacks

Search Emojis: