31 במאי 2008

טוויטר חי או מת - פרשנות מהעורף

טוויטר נהפך בזמן האחרון לשיחת היום. בוודאי מכירים, אבל רק בשביל הפרוטוקול אגדיר אותו כשרות מיקרו-בלוגים שנותן למשתמשיו לפרסם הודעת קצרות ולאחרים "לעקוב" אחריהם, כלומר לקבל עדכונים על מה הם עושים. קוראים לזה גם מיקרו-בלוג כיוון שההודעות מזכירות פוסט של בלוג, אבל הן מאוד קצרות (140 תווים).
מעבר לחדשנות שבאופי השרות, בזמן האחרון יש הרבה דיבורים על כך שהשרות לא עומד בעומס המשתמשים. כל יומיים אני קורא בבלוגים שטוויטר שוב למטה, טוויטר חזר וכיו"ב.
זה הגיע עד כדי כך שאפילו כבר יש פרשנויות על "למה הפעם טוויטר נפל", או מה השגיאה הבסיסית בתכנון של טוויטר, איך בונים מערכת כזו כך שתעמוד בעומס ועוד כהנה וכהנה פרשנויות. ויש אפילו פרשנים מומחים לעניינים האלה, כאלה שבנו מערכות דומות, מומחי תקשורת, מומחי מסדי נתונים, מומחי ווב ועוד.
ולמה הדבר דומה? בהיותי תושב חיפה לא יכולתי שלא להזכר בסיטואציה דומה שהיתה בישראל רק לפני שנתיים. מלחמה בלבנון, פה ושם קטיושות בצפון ולכל תחנת רדיו או טלויזיה יש את סוללת הפרשנים המומחים שלה. כאלה שהיו מולטי-רמטכלים בעבר, אלה שפיקדו על שלושה חיילות אוויר בארבעה צבאות שונים, אלה שדוברים ערבית עוד מילדותם בביירות ועוד מומחים שונים ומשונים. החזית של ישראל היתה בלבנון והעורף פירשן אותה.
החזית של טוויטר נמצאת בסן פרנסיסקו ואנחנו בעורף מפרשנים אותה.

29 במאי 2008

vi


בעבר כתבתי פוסט על מלחמת העורכים. לא מדובר פה על המלחמה של עורך ידיעות אחרונות בעורך מעריב, גם לא עורך בריטניקה ועורך האנציקלופדיה העברית. לא ולא, מדובר בעורכי טקסט של יוניקס או לינוקס.
אז היו לנו כבר מלחמות דפדפנים (אספלורר נגד נטסקייפ 0:1) מלחמות של מערכות הפעלה (לינוס ווינדווס) ובשקט בשקט, בחשאי ובשושו מתנהלת בקרב קהילת מפתחי ה*קס מלחמה קדומה הרבה יותר, היא מלחמת vi ב emacs. זו מלחמת האצבעות הארוכות והגמישות בסדרת המקשים הממוריאלית.
אז אני החלטתי בסופו של דבר לקחת צד במלחמה זו ואתמול בלילה מצאתי את עצמי נכנס למיטה עם אהובתי ועם ספר חדש שזה עתה רכשתי באמזון Learning the vi Editor שיש לו, אגב, ציור של חיה לגמרי לא ברורה (מי שיודע מה זה מוזמן להגיב)



22 במאי 2008

משרות בגוגל - רק תזכורת

לגוגל יש כנראה דרך קצת שושואיסטית לפרסום משרות.
המשרות מפורסמות כאן http://www.google.co.il/jobs, אבל הסתבר לי שאפילו אנשים בישראל שהם עובדי החברה, לא מודעים לסל המשרות הרחב המוצע שם. עכשיו אתם יודעים.
מוגש כשירות לציבור מטעמי ;-)

20 במאי 2008

סרגיי בארץ הקודש

כולם יודעים, כולם כבר ראו שאחד מהמייסדים של גוגל ביקר בארץ שבוע שעבר. הוא הוזמן ע"י פרס לועידת הנשיא ועל הדרך גם הקדיש קצת זמן לעובדי גוגל בישראל, שעל זה יש לי צנזורה, ולגיקים של יוסי ורדי, שעל זה אין צנזורה.
את יוסי ורדי כולם מכירים. הוא מכונת יחסי ציבור מהלכת, "האבא של האינטרנט בישראל", אם לא בבחירת הקהל, הרי שלפחות ע"פ גילו.
הגיקים בגראז' זו חבורה של חובבי טכנולוגיה עם מקום מפגש קבוע בחולון, מוסך ישן, שנפגשים בסופי שבוע ועושים כל מיני פרוייקטים טכנולוגיים ביחד, כמו אסלה ניידת, שעון המורכב מגלגלי אופניים, רובוט המנגן בגיטרה ועוד. יוסי, בין השאר הוא גם האבא של המוסך הזה.
כהערת אגב, זה קצת מצחיק שבישראל בחרנו לקחת מוסך לתיקוני רכב ולהפוך אותו למקום מפגש של חנונים. נראה לי שזו בעיה בתרגום. כשאומרים באנגלית אמריקאית גראז' או משתמשים במונח פרוייקט-גראז', כמו שהיתה למשל גוגל בתחילת דרכה, מתכוונים לחניה פרטים שיש ליד הבית, כמו שיש בבתים רבים בארצות הברית, אבל לא מתכוונים למוסך לתיקוני רכב... אך מכיוון שחנייה פרטית בישראל היא כל כך עשירון עליון, אני מניח שמוסך זה עברות מספיק טוב.
בכל מקרה, סרגיי נתן בארוע את הופעת הסטנד-אפ הרגילה שלו, כלומר, לקח שאלות מהקהל וענה בהומור.
כך, למשל כשנשאל "מה אתה עושה כשאתה קם בבוקר?" (לא נראה לי שהוא מכיר את השיר) ענה שיש הנחה סמויה בשאלה... ואז לכאורה הרצין ופירט שהוא מודע לכך שיש עובדי גוגל בקהל (אני למשל) אז התשובה האמיתית היא שכבל יום כאשר הוא מגיע למשרד בשש בבוקר דבר ראשון הוא עובר על האימייל ועונה.
באחד מעיתוני הכלכלה שסיקרו את הארוע היה כיתוב מתחת לתמונתו "מגיע כל יום בשש בבוקר למשרד". הייתי אומר שדבריו הוצאו מהקשרם. יש לי עוד הרבה מה ללמוד בדרך לעיתונאות...



12 במאי 2008

גוגל ראשונה, צ'קפוינט - 18, ובמקום החמישי? חברת החשמל

סקר שנערך ע"י Jobinfo קובע שגוגל ישראל היא מקום העבודה המבוקש ביותר (שנה שניה ברציפות).
פרטים נוספים כאן.

4 במאי 2008

פרוייקט משותף ליד ושם וגוגל

יד ושם פתח שני ערוצים ב YouTube לקראת יום הזיכרון לשואה ולגבורה (שהיה שבוע שעבר) באנגלית ובערבית. הערוץ באנגלית כולל עדויות של ניצולי שואה המשולבות בתצלומים ארכיוניים, הרצאות של היסטוריונים בנושאים שונים הקשורים לשואה, תצלומים של אירועים ומבקרים ביד ושם כגון ביקורו של הנשיא ג'ורג' בוש בינואר 2008 והאפיפיור יוחנן פאולוס השני במרץ 2000. כמו כן, ניתן לצפות בערוץ בסיפורים אנושיים מרגשים כמו איחוד משפחות שהופרדו בשואה.
הערוץ בערבית כולל עדויות המשולבות בתצלומים ארכיוניים מהשואה עם כתוביות בשפה הערבית
.

פעולה זו זכתה ללא-מעט כיסוי תקשורתי: TheMarkerIT, ואללה, ynet, וגם בבלוג הרשמי של גוגל.

ברמה היותר פילוסופית זה מעורר מחשבות איך עוד ניתן לרתום את הטכנולוגיה, והאינטרנט בפרט לצרכים כגון תעוד השואה. יש גם תמונות וממצאים רבים אחרים שלרוב אזרחי העולם קשה מאוד להגיע אליהם או שהם כלל אינם מודעים אליהם.

2 במאי 2008

איך מחשבים את הסרטים הקשורים ביוטיוב

בסוף כל סרט ביוטיוב עולה רשימה של סרטים קשורים היכולה לעניין את הצופה להמשך הצפיה. גם בזמן הצפיה בסרט קיימת רשימת סרטים קשורים מצד ימין. איך מחשבים את הרשימה הזו?
זו בעייה מעניינת... יש מליוני סרטים ומיליוני צופים, אז איך ניתן להתאים לצופה את הסרטים שיעניינו אותו ביותר?
מי שיש לו ניסיון באיחזור מידע קלאסי או איחזור מידע באינטרנט, דבר שגוגל מתמחה בו, יבין שאם היה מדובר בעמודי אינטרנט ולא בסרטי וידאו ניתן היה להשתמש בטכניקות עשירות המסתמכות על ניתוח טקסטואלי, קישורים בין עמודים וכו'. ואולם, על סרטי וידאו, בניגוד לעמודי אינטרנט, אנחנו יודעים הרבה פחות. לוידאו אין טקסט שאפשר לנתח, לוידאו אין לינקים, יש מעט מאוד אינפורמציה טקסטואלית שניתן להשתמש בה (כותרת, תגים, תאור קצר), ולא ניתן להחיל את אלגוריתמי איחזור המידע המשוכללים הקיימים לעולם הטקסט, אבל העם רוצה וידאו, אז צריך למצוא לזה פתרון.

במאמר המפורסם כאן, תחת הכותרת של מאמרים שנכתבו ע"י גוגלרים, מציעים תשובה לבעיה זו, ולהלן תקצירה.
הרעיון בגדול הוא לתת המלצות של סרטים קשורים ע"פ אינפורמציה שיש על "צופים דומים", כלומר משהו בסגנון של "אנשים שאהבו וידאו זה אהבו גם את הרשימה הבאה".
זה אולי קצת מזכיר את מערכת ההמלצות המפורסמת של אמזון, אבל יש הבדלים רבים בין השיטות.
קודם כל, איך ניתן לדעת שמי שצפה בוידאו באמת אהב אותו?
בנוסף, הקהל שצופה ביוטיוב הוא אינו בהכרח "נאמן" במובן שיש הרבה צופים מקריים שמגיעים פעם או פעמיים, לפעמים ממחשבים שונים בבית ובעבודה ולכן קשה יותר לעקוב אחריהם. (באמזון אם מישהו רוכש משהו הוא חייב לעשות לוג-אין).
ויש עוד מספר הבדלים, כגון המספר הגדול של הצופים ושל הסרטים, טרנדים יומיים, סרטים שהם מאוד פופולריים באופן גלובלי וצפייה בהם לא בהכרח מעידה על טעם אישי ועוד.
ע"מ לפתור את הבעייה של האם הצופה אהב את הסרט משתמשים בהנחה של אם הצופה צפה בסרט לפחות עד 30% מהזמן, ככל הנראה הוא אהב אותו.
ֿהשיטה המתוארת במאמר נקראת באופן כללי "אלגוריתם ספיגה". אלגוריתם זה משתמש בגרף המורכב מסרטי וידאו שלכל אחד מהם תגיות המעידות על טעמם של הצופים בסרטים. האלגוריתם באופן איטרטיבי "מחלחל" את את התגיות של סרט כלשהו לסרטים השכנים. ואיך מגדירים מה הם "סרטים שכנים", כלומר סרטים שיש בינייהם קשת? הגדרה זו משתמשת במונח צפיה-משותפת (co-view), כלומר סרטים שצופה צפה בהם אחד אחרי השני (והפרטים המלאים במאמר).

בסה"כ מאמר מעניין, שככל הנראה הוא רק תחילתו של מחקר בתחום חדש זה.