כתבתם קוד סודי - תרגמתם ספר עבור גוגל . מיליוני מילים, מיליוני ספרים. צילום: עידן גולדווסר

כתבתם קוד סודי - תרגמתם ספר עבור גוגל

מה יקרה אם נספר לכם, שכאשר אתם מזינים Captcha (הקוד שבדרך כלל מעכב אותנו מספר דקות בדרך להרשמה, שליחת תגובה וכניסה לאתרים), אתם מתרגמים עבור חברת גוגל ספרים שלמים - תאמינו?

היום בעידן המודרני, שואפים שכל ספר יהפוך להיות 'ספר אלקטרוני', אבל איך הופכים מיליוני ספרים לטקסט במחשב?

הפתרון הפשוט הוא טכנולוגית OCR (ר"ת Optical Character Recognition). הטכנולוגיה הזו ממירה תמונה סרוקה למידע במחשב, אולם אין מה לעשות כשמדובר בטכנולוגיה שלפעמים כושלת. OCR לא תמיד מצליחה לקרוא כל מילה ולעיתים נוצר למחשב בלבול בין אותיות, וזה בשל שלפעמים יש צורך לתרגם ספרים ועיתונים ישנים מהעבר, או שהפונט והגודל לא קריאים במיוחד.

הקאפצ'ה המדוברת. צילום: צילום מסך.
 

אז איך זה עובד?

כאשר אתם מגיעים לקאפצ'ה, מופיעות לכם שתי מילים. הראשונה מילה ברורה למחצה והשנייה מילה רנדומאלית לגמרי. חברת ReCaptcha שמצאה פתרון לבעיית תרגום אלפי הספרים, סורקת את הספרים והעיתונים ומעלה את המילים לתוך הקאפצ'ה - שם כל גולשי האינטרנט כותבים את המילה שהם רואים ומתרגמים אותה לדיגיטלית.

החברה לוקחת את אותה תוצאה שעשרה אנשים הכניסו עבור אותה מילה, עושים מכנה משותף ומקבלים את המילה הנכונה. בצורה הזאת לא משתמשים ב-OCR לזיהוי מילים, אלא על ידי אנשים מכל העולם, כאמור בלי ידיעתם (עד היום לפחות).

בזכות הרעיון הגאוני של החברה, מידי יום האנושות שומרת על שני עקרונות חשובים: הראשון נלחמים בספאמרים והשני שומרים על ספרים שלא ייכחדו מהעולם.

בשנת 2009 חברת הענק גוגל הבינה את המשמעות הכלכלית והעתידית של ReCaptcha, ועל כן חברת הענק החליטה לרכוש אותה עוד בתחילת דרכה. נכון להיום גוגל מתרגמים מיליוני ספרים בשנה ומיליוני מילים ביום. יתרה מזאת, גוגל רתמה את פרויקט התרגום לטובת לפרויקט 'גוגל ספרים' (מאגר דיגיטלי של ספרים השייך לגוגל)

אז אל תטעו בקאפצ'ה חברים, אתם עלולים להשחיט ולו בטעות את התנ"ך המתורגם או את הקוראן, שנכללים גם כן בתרגום.

>> הצטרפו לעמוד הפייסבוק של פרוגי

תגובות