על שמות מתחם בעברית

גל מור מרכז מספר טיעונים נגד רישום שמות מתחם בעברית. מכיוון שיצא לי קצת לדבר עם אנשים באיגוד האינטרנט בזמן התהליך, אני יכול להגיד שלפחות חלק מהביקורת נובע מבורות. להלן הביקורת של תומר, והתשובות של האיגוד כפי שאני מבין אותן. אני אבהיר שאני לא דובר רשמי של האיגוד, ורק עונה על פי מיטב הבנתי את שיקולי האיגוד בנושא.

איגוד האינטרנט מפלה דוברי שפות אחרות

בקצרה – אי אפשר לערבב שתי שפות באותו מתחם, ואי אפשר לרשום שמות מתחם בערבית. במקור מתומר כהן.

הסיבה שלא ניתן לעשות את הראשון, חוץ מאשר בעיות ה-bidi החריפות שלהן זה גורם, היא בדיוק כדי למנוע את ביקורת מספר 4. עוד בהמשך. הסיבה שאי אפשר לרשום שמות מתחם בערבית היא הרבה יותר "משעשעת".

הסיפור שסופר לי, עד כמה שזכרוני משרת אותי, הוא שמסתבר שהמדינות הערביות רוצות שרק מדינות ערביות יוכלו לרשום שמות מתחם בערבית. כבר היתה מדינה (אם אני זוכר נכון, פולין) שאפשרה רישום שמות מתחם בכל שפה שהיא, והתוצאה היתה שמדינות ערב תקפו אותה על עצם העבודה הזו. איגוד האינטרנט הבין שהוא עומד פה מול הפרדוקס של בארט סימפסון (you're damned if you do, and you're damned if you don't), והחליט, בשלב זה, to don't.

בעוד שאין לי מושג מהי נטיתו הפוליטית של גל מור, הוא חוטא בחטא השמאל הקיצוני בישראל בכך שהוא גל מור חוטא פה בכשל לוגי, בכך שהוא מאשים את הממשלה בכל דבר אנטי ערבי או אנטי ערבי לכאורה שקורה במדינה, לא משנה מי עשה אותו. אני מוצא את זה כ-weasel argument שיש להתבייש בו (אבל לא סיבה להדביק הטיה פוליטית כזו או אחרת לגל, אז סליחה גל).

מסורבל ולא ידידותי

בקצרה, בהעתקה מקבלים את הקידוד של שם המתחם, ולא את שם המתחם עצמו. טיפת מחשבה היתה מראה שהבעיה הזו נובעת מהדפדפנים, ולא מאיגוד האינטרנט, ורלוונטית לכל שמות המתחם תחת IDN. גל מור עשוי לטעון שזה עדיין טיעון נגד IDN, אבל אני טוען שיש פה בעיה של ביצה ותרנגולת. הדפדפנים לא יחפשו פתרון טוב יותר להעתקה ב-IDN אם הוא לא בשימוש, ולכן לא הגיוני שלא להכניס IDN עד שהדפדפנים ימצאו את הפתרון. זה נכון בפרט כשמבינים מדוע הדפדפנים לא מאפשרי העתקה של IDN בצורה שקופה, בגלל העדר תמיכה בזיהויי ה-URL האוטומטיים שקורים בכל מקום ושלא תומכים ב-IDN. במילים אחרות, תמיכה ב-IDN צריכה להכנס בהמון מקומות (כולל Word) לפני שאפשר יהיה לקרוא לה "טובה", אבל אם לא נתחיל זה וודאי שגם לא נסיים.

הטיעון השני היה לגבי השילוב האוטומטי בין שמות עבריים ל-top level אנגלי. כלומר, קשה להבין "http://לינגנו.co.il". בפעם האחרונה ששאלתי מישהו מהאיגוד, הוא אמר שיש בעיה אמיתית איך לתרגם. האם לתרגם את "http"? לְמָה? יאאפ? ומה עם רמה 1 ורמה 2? יאאפ://לינגנו.מסחרי.ישראל זה נראה למישהו הגיוני? אני לא יודע אם ולאן התקדם הדיון מאז, כך שאני לא יודע מדוע זה טרם קרה.

הגבהת חומת השפה

במקור מפרופ' קרין נהון. זה דווקא טיעון שאני מבין. אני לא בטוח אם אני מסכים איתו, אבל אני יכול להבין מאיפה הוא בא. אני חושב שעלות שמות המתחם היא לא מאוד גבוהה, כך שאתרים דו לשוניים ממילא יכולים לתת, כברירת מחדל, אתר אחד בכתובת העברית ואתר אחר באנגלית. העלות הנוספת של 70 שקלים לשנה לא תעשה את ההבדל, לדעתי.

סכנה של הונאות

בקצרה, אותיות שונות משפות שונות יכולות להראות אותו הדבר. במקור מעירא אברמוב, אבל הקישור שגל נתן מצביע לבלוג של פרופ' קרין נהון, כך שאני לא יודע איזה פוסט.

זה מאפשר לייצר אתר שנראה כאילו הוא אתר רשמי של חברה כלשהי (כולל חתימת SSL תקפה), בעוד שהוא לא. כדי למנוע את ההתקפה הזו, איגוד האינטרנט החליט שלא לאפשר רישום של שם מתחם שמכיל כמה שפות. כמובן שזה גרם להתקפה עליו, אבל על פרדוקס בארט סימפסון כבר דיברנו.

בקיצור, אני חושב שהרבה מהביקורת קצת נטולת מחקר.

שחר

מאת

שחר שמש

מייסד ומנכ"ל "לינגנו ייעוץ קוד פתוח בע"מ" חבר ועד בעמותת "המקור" וסתם פעיל קוד פתוח ולינוקס

19 thoughts on “על שמות מתחם בעברית”

  1. יש לך את זה עם פונט יותר גדול?
    פשוט האתר שלך עם פונט קטן קצת מקשה את הקריאה

  2. לגבי המחיר לשני שמות מתחם, אתה צודק שזה לא מגבלה לאתר מסחרי, אבל לאנשים פרטיים זוהי מגבלה אמיתית.

    בעיה נוספת שמשום לא הועלתה היא ששמות מתחם בעברית (ולמעשה בכל שפה שמשתמשת באותיות שהן לא ASCII) הוא השמוש בו בכתובת דואר. איך תבקש ממישהו שאינו דובר עברית שישלח לך דוא"ל ל-אהוד@המקור.עמותה.ישראל (או כל קיצור אחר שיהיה לסיומות).

  3. להערכתי איגוד האינטרנט בחר לאפשר שימוש בתווים בעברית בלבד ב־IDN היא כדי לצמצם למינימום את ווקטור הזיופים. ערבית, למשל, היא שפה הרבה יותר מסובכת מבחינת אותיות, ועשוי להיווצר מצב שמישהו ירכוש שם מתחם דומה לשם מתחם קיים, אבל כולל אות אחת בצורה שונה, כך שרק עין מיומנת תבחין בזה.

    rfc 5564 מתייחס לנקודה הזו ממש ומציב סט של תנאים כדי לאפשר רישום שמות מתחם בערבית. אני חושב שתסכים איתי שהרבה יותר קל להתעלם מהשפה הזו מאשר לממש את התנאים הללו, והגדרת מרחב אותיות מינימלי עבור עברית הוא אכן הדרך הטובה ביותר להתמודד עם עברית, בלי כל מיני מתחכמים שישלבו תווים ביידיש בשמות מתחם ויגרמו לבעיות משעשעות (לדוגמה – "וואלה!" ≠ "װאלה!").

    למרות זאת, מן הראוי היה שהאיגוד יסביר בעצמו למה ניתן לרשום שמות מתחם רק באנגלית או רק בעברית, ולא גם שפות נוספות ושילוב מספר שפות בכתובת. להגיד שמדינות ערביות יתנגדו למהלך שלנו לשרת את אזרחי המדינה (ומשלמי המיסים) דוברי הערבית נשמע לי בעיקר כמו תירוץ.

    לגבי תרגום שאר חלקי הכתובת, זה מאד מסוכן, ועשוי אפילו לחשוף אותנו לבעיות אבטחה אם זה לא יטופל בצורה הנכונה. לדעתי סיומת שם המתחם החדשה צריכה להיות "ישראל" ולא "יל" או כל מיני קיצורים מגוכחים דומים, אבל לדעתי עדיף יהיה להיפטר באותה ההזדמנות מהרמה השנייה, כך שהתבנית תהיה "דוגמה.ישראל"; גם ככה כולם רושמים שמות מתחם ב־co.il ו־com בלי להבין או להתייחס לכך שהסיומת מיועדת לאתרים של חברות מסחריות בלבד, ובמדינה קטנה כמו שלנו אין שום היגיון עם ההפרדה הזו.

  4. השפה הערבית היא שפה רשמית במדינת ישראל, אז נראה לי שלמטרה הזו אנחנו מדינה ערבית. אני לא מכיר את הסיפור עם פולין, יש לך לינק? (גוגל לא מכיר אותו, לפחות לא מבלי לרענן את זכרונו מעט יותר משניסיתי.)

  5. אין לי לינק. יש לי זכרון של משהו שנאמר לי לפני יותר מחודשיים. אני אפילו לא בטוח שמדובר בפולין.

    בגדול, מה שהבנתי זה שלהכניס ערבית עומד להרים קלחת מאוד גדולה, ומכיוון שגם עברית היא קלחת לא קטנה, האיגוד החליט לדחות את כאב הראש הזה.

    שחר

  6. כל עוד התוכנה בה אתה משתמשת תומכת ב־IDN, לא אמורה להיות בעיה לשלוח דואר ל־אהוד@המקור.ארגון.ישראל.

  7. תומר הבין את הבעיה – הכתובת ב-ASCII היא חסרת משמעות ואי אפשר לזכור אותה כלל.

  8. אהוד,

    יש סתירה בין הביקורות. מצד אחד אתם אומרים שאף אחד לא מקליד שמות אתרים, אז לא צריך שהם יהיו בעברית. מצד שני, כאשר אני עונה שכן אפשרי להגיע לאתר גם אם התוכנה לא תומכת בעברית, אז אתה אומר שבלתי אפשרי להקליד את זה.

    שחר

  9. אין לי מושג לאיפה גלמור ניסה ללנקק אצלי בבלוג, אני רק זוכר שהיה מישהו שרשם דומיין של microsoft עם אות שנראתה בדיוק כמו o למי שהציץ בלינק אבל למעשה היתה אות גבוהה ביוניקוד. אולי כתבתי על זה פעם בבלוג, אבל לא מצאתי את זה היום בחיפוש.

  10. עירא, הפניתי לתגובה שלך בבלוג של קרין. שחר, איבדת אותי במילים "חטא השמאל הקיצוני". צר לי. תודה על ההתייחסות

  11. תודה על התיקון. הטענה שלי התייחסה לכך שערבית היא שפה רשמית במדינת ישראל והממשלה צריכה לספק תשתית לשירותים לכלל האזרחים. אין הקיפוח של ערבית לצורך זה שונה מקיפוח של בעלי מוגבלויות במתן שירות וכך הטענות הפוליטיות ששרבבת לא רלוונטיות.

  12. אני לא שירבבתי טענות פוליטיות. אני אמרתי שלהאשים את הממשלה שמשהו שגוף פרטי עושה זה כשל לוגי.

    לגופו של עניין, הטיעון של איגוד האינטרנט היה, בגדול, שהם עומדים להסתבך בפוליטיקה בין אם הם יכניסו את זה בשלב הראשון ובין אם לאו. מכיוון שיש מספיק קלחת פוליטית גם לגבי שמות המתחם העבריים (הסיבה שעוד לא התקבלה החלטה על רמה 1 ורמה 2), הם הרשו לעצמם לדחות את כאב הראש שקשור בערבית טיפה. לאור העובדה שמדובר במתנדבים, ובתור מישהו שמתנדב בעצמו בנושאי תקינה, קשה לי למצוא פסול בטענה הזו.

    לא שמעתי אף טיעון שאומר שלא צריך לתמוך בערבית, ולכן הטענה שמדובר בגזענות נשמעת לי מופרכת.

    שחר

סגור לתגובות.