היסטוריה חלק 2 (או: משפט המבנה של הקאנג'י)

בפעם הקודמת דיברנו על איך התפתח הכתב היפני - הקאנג'י (שמקורו בתווים סיניים) וממנו שתי מערכות הקאנה. יש אלפי תווים סיניים (ובהתאם גם אלפי קאנג'י), מה שהפך את התיעוד של השפה למאתגר מאוד. לפני המצאת המחשבים, כדי ליצור מילון היו חייבים לסדר את המילים בשפה בצורה לינארית. במרבית השפות קיים אלפבית שהוא לרוב בסביבות 30 אותיות, אז קל מאוד לסדר את המילים בסדר לקסיקוגרפי; אבל בסינית לא רק שהיה קשה לסדר את המילים, אלא אפילו את התווים עצמם!

במאה ה3 לפנה"ס נכתב הErya - המילון הסיני העתיק ביותר שתוכנו שרד (רוב המסמכים העתיקים לא נכתבו על עצם או אבן, ומילונים בוודאי שלא. מסמכים שנכתבו על חומרים אורגניים כמעט אף פעם לא שרדו אלפי שנים, אז ב"תוכנו שרד" הכוונה לשכתובים מאוחרים יותר שלו!) במילון הזה, כמו כל המילונים הסיניים המוקדמים, המילים היו מסודרות לפי 19 נושאים כמו "הרים", "ציפורים", "דגים" ושאר מה שחשוב. אבל עד כמה שזה חיוני לרכז את כל המילים שקשורות לציפורים במקום אחד, זו לא חלוקה חכמה כל כך לשונית והיא עוזרת רק בכיוון אחד - כתיבה! חייבים לדעת מה משמעות המילה כדי לחפש אותה במילון. גם היום, אבל בפרט בחברות קדומות, קריאה היא הכרחית בהרבה לאדם הממוצע מאשר כתיבה - כתיבה היא מותרות של מלומדים, בעוד שקריאה צריך בשביל לדעת חוקים, לעשות קניות, להתמצא במקומות וכדומה.

ב100 לספירה Xu Shen כתב את הShuowen jiezi, מילון של תווים סיניים (נועד ספציפית לסיווג התווים, לא מילים מורכבות) ובו יישם רעיון נהדר: התווים הסיניים בנויים מרכיבים (components). מכל תו סיני בוחרים רכיב אחד שיהווה את ה部首 (bù shǒu = section header) של אותו התו, ואז כל תו יימצא במילון תחת הbù shǒu שלו. (מערביים נתנו להם את השם radix, שזה root בלטינית, כאנלוגיה ל"שורש" של מילים שקיים בשפות אירופאיות - ולמעשה כמעט בכל השפות מבוססות-אלפבית, כולל עברית. השם הזה התפתח עם הזמן ל"רדיקל".) הרשימה של הShuowen jiezi כללה 540 רדיקלים, וכך במקום לזכור 9,353 תווים סיניים מורכבים באופן יחידני, המילון הזה אפשר לקורא לדעת בוודאות לפחות רכיב אחד של כל תו על ידי למידת 540 סימנים פשוטים בהרבה. יש לציין שXu Shen בחר להשתמש בsmall seal script (האחד שהשלטון החיל ב221 לפנה"ס, זוכרים?) למרות שהוא כבר יצא משימוש יומיומי לטובת הclerical script. הסיבה שהוא בחר בוריאציה הישנה זה כי היא מבטאת בצורה יותר טובה את הויזואליות של התווים; הוריאציות המאוחרות יותר פישטו אותם כדי שיהיו יותר מהירים לכתיבה, אבל במקור הם היו ממש ציורים (jumpscare).

שיטת הסידור שXu Shen המציא הובילה להיותו של הShuowen jiezi מילון מצליח מאוד ורשימת הרדיקלים שלו הייתה מקובלת מעל ל1000 שנה, למרות שהרבה רדיקלים שכללה נחשבו מיותרים. אבל הסידור לפי רדיקלים הוא לא הסיבה היחידה שהפכה את הShuowen jiezi למהפכני - זה היה גם המילון הראשון שניתח את מבנה התווים וחילק אותם לסוגים. Xu Shen הגדיר 6 סוגים, שלמעשה מתוכם רק ה4 הראשונים סיווגו את כל התווים לפי המבנה, והשניים האחרונים הם צורות שימוש מיוחדות שיש לתווים מסוימים. החלוקה ל4 הסוגים הראשונים עדיין מקובלת, לא רק לתווים סיניים אלא גם עבור קאנג'י (כן, צריך להזכיר מדי פעם שזה בכל זאת אתר של יפנית...)

עם הזמן seal script הפך לשריד ארכאולוגי רחוק, וכאמור הרשימה של Xu Shen כללה מלכתחילה הרבה רדיקלים שלא היו בהכרח נחוצים. למשל כללה מבנים שחוזרים על עצמם - כמו שלישיה של אותו רכיב, כשהוא פעם אחת למעלה ופעמיים למטה - בתור רדיקל משל עצמו. Xu Shen תיעדף מציאת חוקיות כמה שיותר מדויקת - כלומר כשאדם פוגש תו סיני שבתוכו 孨, הוא בהכרח יימצא אותו במילון תחת המבנה של השלישייה, במקום שזה יתאחד לתוך הרשימה של 子. אבל למרות שגם ההפרדה למבנים מעניינת לשונית, היא מקשה על הקורא - מאריכה את רשימת הרדיקלים אז קשה יותר לזכור את כולם, וגם מבחינת החיפוש אמנם הרשימה של כל רדיקל עכשיו יותר קצרה, אבל החיפוש של הרדיקל עצמו יותר ארוך. שנים רבות אחר כך, ב1615, המלומד Mei Yingzuo הגדיר רשימה מצומצמת של 214 רדיקלים וערך מילון לפיה, Zihui. החלוקה שלו הייתה יעילה בהרבה והמילון זכה להצלחה, אבל זו עדיין הייתה יצירה של אדם אחד. מאוחר יותר נכתב על בסיס רשימה זו הKangxi Dictionary, שיצירתו הייתה בציווי הקיסר ובהתאם עבר עריכה מעמיקה והפצה נרחבת בהרבה - עד כדי כך שעד היום הרשימה של 214 הרדיקלים היא הסטנדרט למילונים סיניים ויפנים ומכונה "Kangxi radicals", ולא "Zihui radicals" (חבל).

עם המצאת המחשבים הגיעו גם המילונים הממוחשבים שהם גמישים הרבה יותר. אין שום הכרח לסדר את כל התווים לפי סדר מסוים כדי שאנשים יוכלו להתמצא בהם - כי יש פשוט שורת חיפוש. בגלל זה הרעיון של "רכיב ראשי" יחיד מכל תו הוא כבר לא הכרחי, וביפנית "רדיקלים" הפך להיות מושג נפוץ לתיאור כל רכיבי הקאנג'י. ואמנם מילונים רשמיים נצמדים לרוב לרשימה המסורתית של 214 רדיקלים, אבל אתרים רבים מגדירים רשימת רדיקלים משל עצמם; כי כפי שבטח כבר הבנתם עד עכשיו, כל ההגדרות של "מבנה תווים" ו"רדיקלים" נוצרו מהתבוננות בשפה הטבעית בניסיון לעשות בה סדר. השפה היא מה שמנסים לתאר - כל מתבונן חופשי לתאר אותה בדרך שהכי נוחה לו.

לאחר ההקדמה הגרנדיוזית, הנה הגישה של אתר Kanjivrit:

הרדיקלים הם אבני הבניין של כל הקאנג'י. אמנם כל קאנג'י מורכב מרדיקלים או מקאנג'ים אחרים (מיד נפרט למה), וגם התת-קאנג'ים הללו מורכבים מרדיקלים או מקאנג'ים אחרים וכן הלאה, אבל בסוף תמיד נגיע לקאנג'י שמורכב מרדיקלים בלבד. (היוצא מן הכלל הם מספרים שמוגדרים ישירות כקאנג'י, כי הם כל כך בסיסיים שאין היגיון לפרק אותם לרדיקלים לדעתי.)
איך נגדיר את הרדיקלים? אם מכוונים לרשימה קטנה ככל האפשר אז נכלול רק את הרכיבים "הפשוטים ביותר" - אלה שלא מתפרקים בעצמם לכמה חלקים. הבעיה היא כשרכיב שכן מורכב מכמה חלקים חוזר על עצמו בהרבה קאנג'ים. יש המון מקרים כאלה, לכן שווה ללמוד אותו בפני עצמו במקום לנסות לזכור את אותה קומבינציה של רדיקלים שוב ושוב ושוב!

אז אם הרכיב הזה הוא קאנג'י בעצמו מצויין - פשוט נשתמש בו בתור רכיב מבלי לסרבל את רשימת הרדיקלים (לכן מותר לקאנג'ים להיות רכיבים בקאנג'ים אחרים). אחרת - יוגדר כרדיקל.
גם רדיקלים וגם קאנג'י יכולים להוות רכיבים פונטיים. הקורא הסקרן שקרא על הסיווג של התווים כבר יודע כבר מה זה, אבל נגדיר גם כאן. רכיב פונטי הוא אינדיקציה לקריאה של הקאנג'י - מאחר שהתווים הגיעו במקור מסינית זה רלוונטי לקריאה onyomi בלבד, לא להגייה היפנית. זו אמנם אינדיקציה שעוזרת לנבא את הonyomi כשפוגשים קאנג'י לא מוכר, אבל זה לא חוק מחייב ויתכנו קאנג'ים שמכילים רכיב פונטי ולא שואבים את הonyomi ממנו. באתר, רכיבים פונטיים מסומנים על ידי PHONETIC COMPONENT וקאנג'י שהonyomi שלו מציית לרכיב פונטי מסומן בSAME-ON.
קאנג'ים הם כידוע סמנטיים (מייצגים משמעות/ מספר משמעויות קרובות זו לזו), ובהגדרת אתר זה גם כל הרדיקלים הם סמנטיים. אכן, רכיבים פונטיים הם לא תמיד סמנטיים במקורם - במקרה כזה אני מנסה להמציא משמעות שתעזור לי לזכור את הקאנג'ים שהם מוכלים בהם.

קאנג'ים: 子