Sorry I forgot to do that. Here you are: <a href="http://www.circleid.com/posts/7101414_difficulties_displaying_internationalized_domains/">http://www.circleid.com/posts/7101414_difficulties_displaying_internationalized_domains/
</a><br>ar<br><br><div><span class="gmail_quote">On 10/19/07, <b class="gmail_sendername">Mawaki Chango</b> &lt;<a href="mailto:ki_chango@yahoo.com">ki_chango@yahoo.com</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Thanks AR for the news... could you perhaps also provide the<br>link for the original post, please? I&#39;m not sure the<br>illustration in the text came out well as I don&#39;t seem to see<br>how one could distinguish right and left from the strings of
<br>symbols and characters displayed, thanks, Mawaki.<br><br>--- Anne-Rachel Inn� &lt;<a href="mailto:annerachel@gmail.com">annerachel@gmail.com</a>&gt; wrote:<br><br>&gt; Current Difficulties With Displaying Internationalized
<br>&gt; Top-Level Domains<br>&gt; Oct 15, 2007 8:50 AM PST | Comments: 1<br>&gt; By Kim Davies<br>&gt;<br>&gt; Earlier this week, we inserted eleven new top-level domains in<br>&gt; the DNS root<br>&gt; zone. These represent the term &quot;test&quot; translated into ten
<br>&gt; languages, in ten<br>&gt; different scripts (Chinese is represented in two different<br>&gt; scripts, and<br>&gt; Arabic script is used by two different languages).<br>&gt;<br>&gt; This blog post is not about that. (If you&#39;re interested about
<br>&gt; it, read our<br>&gt; report on the delegations.)<br>&gt;<br>&gt; What I would like to talk about is some of the difficulties we<br>&gt; face today in<br>&gt; expressing scripts in a consistent way over the Internet. The
<br>&gt; fact is,<br>&gt; whilst we are at the best time in history for having computers<br>&gt; represent<br>&gt; many different languages clearly and consistently, we are<br>&gt; still a long way<br>&gt; from the level of support needed to give us strong confidence
<br>&gt; that people<br>&gt; can always see what we intend them to see.<br>&gt;<br>&gt; To illustrate, I will list all the eleven new top-level<br>&gt; domains. On the left<br>&gt; is the version your web browser wants to present to you, and
<br>&gt; on the right is<br>&gt; how it should actually look.<br>&gt;<br>&gt; إختبار<br>&gt; آزمایشی<br>&gt; 测试<br>&gt; 測試<br>&gt; испытание<br>&gt; परीक्षा<br>&gt; δοκιμή<br>&gt; 테스트<br>&gt; טעסט<br>&gt; テスト<br>&gt; பரிட்சை
<br>&gt;<br>&gt; If you find some of the versions don&#39;t match, you would be in<br>&gt; the majority<br>&gt; of Internet users. The fact is most people cannot see these<br>&gt; labels properly<br>&gt; and consistently.
<br>&gt;<br>&gt; The most likely problem you will face is that there will be<br>&gt; some labels that<br>&gt; you simply cannot see, because your computer does not have any<br>&gt; font that can<br>&gt; express the characters. When the correct font can not be found
<br>&gt; it will<br>&gt; usually display something like the following:<br>&gt;<br>&gt; Computers never come with the complete set of fonts that will<br>&gt; allow it to<br>&gt; show every possible IDN in the world. The primary concern is
<br>&gt; to supply fonts<br>&gt; that allow the language used on the computer to work, and the<br>&gt; rest are<br>&gt; optional. Often this is fixed by downloading additional<br>&gt; language packs for<br>&gt; the missing languages, or specifically finding and installing
<br>&gt; fonts that<br>&gt; support the wanted languages.<br>&gt;<br>&gt; Finding fonts is sometimes only half the battle. English, on<br>&gt; the scale of<br>&gt; languages, is one of the simplest to represent by computer. It
<br>&gt; has 26<br>&gt; letters, and they always look the same and are presented the<br>&gt; same no matter<br>&gt; what order they are in. Sure, they may be stylistic variants,<br>&gt; but in terms<br>&gt; of composing letters it is very simple.
<br>&gt;<br>&gt; Take a look at this:<br>&gt;<br>&gt; On the left is the correct way to present this, but those of<br>&gt; you that do<br>&gt; have Arabic fonts may find that you see the version on the<br>&gt; right. This is
<br>&gt; because Arabic has more complex rules on how letterforms<br>&gt; should be connected<br>&gt; and formed. Some software is more accurate than others on how<br>&gt; it does this.<br>&gt;<br>&gt; The same issue may present itself in Devanagari script:
<br>&gt;<br>&gt; Again, on the right you can see the composing is not working<br>&gt; correctly.<br>&gt;<br>&gt; If you&#39;re really unlucky, for the Arabic version you may be<br>&gt; seeing this:<br>&gt;<br>&gt; This comes about because Arabic is written right-to-left.
<br>&gt; English, on the<br>&gt; other hand, is written left-to-right. However, this corrupted<br>&gt; example of<br>&gt; Arabic has been written left-to-right - .siht ekil etorw I if<br>&gt; sa<br>&gt;<br>&gt; Ordering problems may also arise when fully blown domain names
<br>&gt; are used.<br>&gt; Imagine a domain like <a href="http://maps.google.com">maps.google.com</a>. Now imagine it showing<br>&gt; up as<br>&gt; com.google.maps. That&#39;s confusing, but imagine the confusion<br>&gt; of
<br>&gt; google.com.maps, or worst of all, as google.com.spam. These<br>&gt; are some of the<br>&gt; variants that have shown when right-to-left ordering issues<br>&gt; appear due to<br>&gt; software problems. (More on this issue is in this presentation
<br>&gt; from the<br>&gt; Israel ccTLD registry.)<br>&gt;<br>&gt; Apart from the visual display issue, there can also be issues<br>&gt; simply in<br>&gt; transmitting these domains in communications. The DNS has been<br>&gt; carefully
<br>&gt; upgraded to support these new domains, but that doesn&#39;t mean<br>&gt; you will get a<br>&gt; consistent experience in other areas. In a discussion on these<br>&gt; new test<br>&gt; domains on an Internet mailing list, one person found they
<br>&gt; were showing like<br>&gt; this:<br>&gt;<br>&gt; This is because the encoding in the email is incorrect.<br>&gt; Generally speaking,<br>&gt; to fully express all the possible IDNs you need to use an<br>&gt; encoding like
<br>&gt; UTF-8. However, ISO 8859-1 is often the default on many mail<br>&gt; programs for<br>&gt; users of English and other Western European languages. The<br>&gt; result of viewing<br>&gt; UTF-8 encoded labels in ISO 8859-1 results in the
<br>&gt; undecipherable letter soup<br>&gt; you see above. If you&#39;ve ever received foreign spam that just<br>&gt; looked like a<br>&gt; list of random letters, this is probably why.<br>&gt;<br>&gt; This is just touching on the number of problems that can
<br>&gt; express themselves<br>&gt; when dealing with the world&#39;s languages and scripts. With the<br>&gt; release of the<br>&gt; evaluative top-level domains, it will provide additional<br>&gt; opportunity to<br>&gt; identify these types of problems, and work with software
<br>&gt; vendors and other<br>&gt; parties to help improve their applications so these issues<br>&gt; will no longer<br>&gt; occur.<br>&gt; &gt; _______________________________________________<br>&gt; AfrICANN mailing list
<br>&gt; <a href="mailto:AfrICANN@afrinic.net">AfrICANN@afrinic.net</a><br>&gt; <a href="https://lists.afrinic.net/mailman/listinfo.cgi/africann">https://lists.afrinic.net/mailman/listinfo.cgi/africann</a><br>&gt;<br><br>
_______________________________________________<br>AfrICANN mailing list<br><a href="mailto:AfrICANN@afrinic.net">AfrICANN@afrinic.net</a><br><a href="https://lists.afrinic.net/mailman/listinfo.cgi/africann">https://lists.afrinic.net/mailman/listinfo.cgi/africann
</a><br></blockquote></div><br><br clear="all"><br>-- <br>Anne-Rachel Inne