Archive for the 'Language' Category

06/05 Unvoluntary 吏讀

Yesterday I was watching 도전 골든벨, a quizz show featuring a bunch of high school kids being eliminated question after question until only one remains. Of course, Korea being Korea it’s all about rote memory and cramming as much useless data as possible into their little brains – doesn’t mean they know shit about life, but the crap they remember sometimes is astounding…

Anyways, yesterday, they were asked to write down 불사조 — 죽지 않는 새 — in sinograms. 13 or so were kicked out after this question, which, well, figures, considering the state of sinograms teaching in Korea [and let’s not get started on things like 베이징 instead of 北京/북경]. I did catch one funny – albeit wrong – answer:

火死鳥

Considering that 火 is [불] 화, this is extremely funny, since that girl had meaning and pronunciation confused. It looked like some old Korean vernacular text written in 吏讀 [이두], where sinograms where sometimes used for their actual pronunciation, and sometimes for their vernacular reading.

Needless to say, I was the only one at home to see this [somehow my family has a tendency to watch TV without really watching, and I am guessing here that it’s not just them… Of course, had I had control over the remote control – firmly held by the head of the family :-( – I would never had watched this show, ㅋㅋㅋ], and the only one I could tell the story without writing it down – like now – was Oranckay

03/31 Tomabaem online light

On the side bar you’ll find a small form that accepts one chinese character, aka sinogram, and will return in the box below that the readings [Cantonese, Mandarin, Japanese, Korean and Viêtnamese] and meanings for this sinogram. This stuff was pulled from the UniHan database, as explained at the Tomabaem main page. Tomabaem Online is a derivate of the desktop app, and is built on indexes of the database that are made offline. Then, a little Python [thanks to 2.4’s unicode codecs, conversion from UTF-16 to UTF-8 is seamless] and grep later, and we have a winner! Which reminds me, I haven’t updated the indexes for a while, I shall do that now. I wrote an RB app that runs 11 threads [must. resist. temptation. to. rewrite. it. in. Erlang.] and the main routine reads the UniHan db and sends text to each thread depending on its content. Here’s a sample:

U+3400 kCantonese jau1
U+3400 kDefinition (same as U+4E18 丘) hillock or mound
U+3400 kHanYu 10015.030
U+3400 kIRGHanyuDaZidian 10015.030
U+3400 kIRGKangXi 0078.010
U+3400 kIRG_GSource KX
U+3400 kIRG_JSource A-2121
U+3400 kIRG_TSource 6-222C
U+3400 kMandarin QIU1
U+3400 kRSUnicode 1.4
U+3400 kSemanticVariant U+4E18
U+3400 kTotalStrokes 5

U+3400 gives me the sinogram’s codepoint, and depending on the kXXXXX tag, I pass each line to a thread storing the data in a separate file. The whole process takes two and a half minutes, and I guess I could do faster. But 160 seconds for 25MB of data is fast enough. So now the indexes are up to date :-) I need to update Tomabaem’s own db, will do that later.

dda> time ./threadIndexer/threadIndexer
Thread kSimplifiedVariant starting...
Thread kTraditionalVariant starting...
Thread kCantonese starting...
Thread kJapaneseOn starting...
Thread kJapaneseKun starting...
Thread kKorean starting...
Thread kMandarin starting...
Thread kVietnamese starting...
Thread kRSKangXi starting...
Thread kTotalStrokes starting...
Thread kDefinition starting...
Done dispatching in 150,204,884µs
Saving kSimplifiedVariant.idx
Saving [...]
Thread kSimplifiedVariant finished...
Thread [...] finished...

real    2m39.733s
user    1m54.760s
sys     0m6.600s

So. Okay, most of the time is spent dispatching, I could improve that…

03/23 P/F same-same, eh

먼저 검찰이 구속기소한 프랑스인 P씨는

국과연 기밀유출, 프랑스 업체 지사장 구속

Er… That would be F씨

03/22 Chroniques coréennes

Ami lecteur, tu n’es pas sans savoir que je suis passionné par la Corée, même si cette passion s’agrémente d’un grain de sel de bonne taille… Prenons le simple exemple du calendrier, chose qui devrait être ô combien objective. La Corée se targue d’une longue Histoire, ce dont les Etats Pas Si Unis Que Cela D’Amérique seraient bien en peine de, une Histoire longue de 5.000 ans, voire d’un demi dix-millénaire. Eh oui, dans les pays de civilisation crypto-chinoise, 10.000 est une unité simple (萬 ou 万), à l’instar de dix (十), cent (百) ou mille (千); 100.000 se dit 十萬 (dix fois 10.000), un million 百萬 (cent fois 10.000), et ainsi de suite. Et donc, les Coréens du pays de la fraicheur matinale – et du matin calme, mais cela, c’est surtout parce qu’ils ne sont pas encore remis de leurs libations nocturnes de la veille – se targuent d’une Histoire 半萬年iène, ie d’une demi dix-millénaire. C’est ainsi, mais ce n’est pas ça qui gêne : depuis 20 ans que je compte mes sous à leur façon, je suis habitué, quoique à 1.200 won l’euro, je suis convaincu que faire un Général de Gaulle à leur monnaie ne ferait pas de mal. Enlevez-moi deux ou trois zéros !

Je m’égare. Leur imagination débordante leur fait dire – après tout, nous avons tous nos légendes – que le fondateur de ce qui est, bon gré, mal gré, la Corée d’aujourd’hui, le ci-devant Tangun, est né 2.333 années avant Jean-Christophe. Ce produit des ébats enflammés d’une ourse et d’un tigre, ou est-ce le contraire ?, mais néanmoins humain – car si le fil de fer barbelé est le rejeton du ver de terre et du hérisson, le premier Coréen est le rejeton de deux animaux velus et sauvages, ce qui a bien changé aujourd’hui – est né donc il y a 4.339 ans.

Pouf Pouf, comme disait le grand Desproges.

Sans vouloir critiquer, il nous manque un demi-millénaire bien tassé, avec monnaie rendue. 661 ans, à vue de nez. Nous voici confrontés à un premier exemple – et rassure-toi, cher lecteur, pas le dernier – de cette culture du 代充 代充, taech’ung taech’ung, autrement dit de l’à-peu-près, si fièrement répandue dans la péninsule. Certains diraient que je chipote, mais il y a 661 ans, la Corée de l’époque, 高麗 Koryŏ, se remettait tout juste d’un siècle d’invasion mongole. En fait, je ne vais pas entretenir le suspense, elle ne s’en remettra pas, et une nouvelle dynastie, encore plus puritaine et coincée que les déjantés du Mayflower, prendra le pas… Je ne sais pas quelle tournure la Corée aura quand elle aura vraiment (et encore, à condition de croire à la légende) 5.000 ans d’histoire, mais nous pouvons parier sur “très différente” sans trop se mouiller…

Pas convaincu ? Un autre exemple issu de la même usine ! L’âge. Ahhh ! L’âge, tout un programme… Je suis né, vieux con que je suis, pendant l’été 1967. Une amie à moi est née en janvier de cette même année. Quel âge avons nous, aujourd’hui, Jeudi 22 Mars 2006 — 05:38 du moins en Corée, décalage horaire GMT+9 oblige ?
Hmmm…?
Moi 40 ans, elle 41.

Pas sympa ça… Eh oui, car ces braves Coréens n’ont pas le même âge que nous. Hormis le décalage horaire sus-mentionné, qui, grâce au plan anti-gaspi, varie entre 7 et 8 heures avec la France de mon enfance, ces braves gens vous collent d’office une année de rab1 pour bons et loyaux services pré-natals2. Entre neuf mois et un an, il y a une marge vite franchie, similaire à 4.339 et 5.000. Que nenni, mon tout bon, que nenni… On pourrait s’attendre, vu leur propension à tout faire vite et mal, à ce que les enfants made in Korea soient conçus en 3 minutes d’allers-retours furtifs – apparemment pas seulement une légende – et 6 ou 7 mois de gestation, bikoze on est pressés (ce qui aurait sans doute plu à l’Homme pressé de Paul Morand). Or, non. Ils ont droit à 10 mois de gestation, certificat du docteur clefs en mains.

Le règne animal ne cessera de me surprendre. La logique derrière cela est que lorsque Mama annonce à Papa qu’il est un homme, un vrai (apparemment après avoir attendu pendant trois mois ses ragnagnas… je rêve !), on fait reculer le calendrier d’un mois, au cycle menstruel précédent. D’où les dix mois, dont un aussi fictif qu’un billet de trois euros.

Donc, un enfant qui naît, il n’a pas une heure, un jour, une semaine, mais un an plus une heure, un jour, une semaine ? Ce serait trop simple. L’addition ne commencera qu’après le premier anniversaire… Le gamin passe d’un an à trois en l’espace de 12 mois. Balaize…

Ami lecteur, crois-tu vraiment qu’ils se sont arrêtés à des broutilles pareilles ? Haha ! Ce serait douter de leurs facultés imaginatives — le soju3 aide vraiment… Ces gens utilisent deux calendriers. Moi aussi, sur mon bureau, j’ai deux calendriers, mais c’est pour voir deux mois d’un coup. Ici, ce n’est pas le cas. En plus de notre bon vieux calendrier Grégorien, ils z’utilisent le calendrier chinois, rebaptisé lunaire pour faire oublier qu’il n’est pas made in Korea. Et c’est là que le rock’n'roll commence vraiment. Reprenons l’exemple des deux personnes nées en 1967. La personne née en janvier 1967 est, selon le calendrier sino-lunaire, pendant la douxième lune de l’an 4.299 de ce calendrier4, finalement franchement chinois, ce que les Coréens, dans un syncrétisme à faire pâlir d’envie les chrétiens réincarnationistes, vous recalculeront en décembre 1966 lunaire. Donc si vous êtes né en “1966″ vous avez un an de plus, non ? Je veux dire, deux ans de plus, puisqu’ils vous en rajoutent un de toute façon…

C’est pas chouette la Corée ?

Notes

1Cela explique que les Coréens croient dur comme fer que j’ai bientôt 40 ans, les sots… Mais pas pourquoi cette amie, née en janvier, a 41 ans.
2 Les anti-avortements applaudiront bêtement.
3 Sorte de dégraisse-boyaux vendu pas cher, car produit en très large quantité et avec des matières premières garanties chimiques. En vente libre, apparemment.
4 Les “siècles” y sont de 60 ans, 5 fois 12 ans (les 五行 cinq éléments – 木火土金水, bois, feu, terre, métal et eau – et les 十二支, 12 rameaux terrestres, autrement connus sous le nom de “signes” : les douzes animaux du zodiaque chinois – 子丑寅卯辰巳午未申酉戌亥, rat, bœuf, tigre, lièvre, dragon, serpent, cheval, mouton, singe, coq, chien et porc. Ces braves z’animaux – en fait les caractères chinois ci-dessus ne signifient pas rat, bœuf, tigre, etc, mais sont associés aux animaux – servent aussi pour indiquer “l’heure”, par groupe de deux heures :
de 23 heures à 1 heure pour 子, l’heure du chien, à 21-23 heures pour 亥, l’heure du porc, ce qui ne surprendra personne…

03/22 Collage of crap

Via Antti, this little gem in the endless flow of Engrish crapvalcade our [ex-]host country knows so well to provide for our amusement and befuddlement:


Collage.of.Huminity

Collagen is Humility?
That’s coming from the [supposedly] numero uno uni in Korea. Yucksers…