直接在命令行中输入native2ascii后可以进入控制台,输入字符串之后native2ascii会将字符串转为unicode编码。
delete all .svn directories using linux find command
linux命令批量删除.svn的目录:
textmate usefull hotkey
java已发行的版本及版本名称
| 类型 | 版本号 | 名称 | 中文名 | 发布日期 |
|---|---|---|---|---|
| JDK | 1.1.4 | Sparkler | 宝石 | 1997-09-12 |
| JDK | 1.1.5 | Pumpkin | 南瓜 | 1997-12-13 |
| JDK | 1.1.6 | Abigail | 阿比盖尔--女子名 | 1998-04-24 |
| JDK | 1.1.7 | Brutus | 布鲁图--古罗马政治家和将军 | 1998-09-28 |
| JDK | 1.1.8 | Chelsea | 切尔西--城市名 | 1999-04-08 |
| J2SE | 1.2 | Playground | 运动场 | 1998-12-04 |
| J2SE | 1.2.1 | none | 无 | 1999-03-30 |
| J2SE | 1.2.2 | Cricket | 蟋蟀 | 1999-07-08 |
| J2SE | 1.3 | Kestrel | 美洲红隼 | 2000-05-08 |
| J2SE | 1.3.1 | Ladybird | 瓢虫 | 2001-05-17 |
| J2SE | 1.4.0 | Merlin | 灰背隼 | 2002-02-13 |
| J2SE | 1.4.1 | grasshopper | 蚱蜢 | 2002-09-16 |
| J2SE | 1.4.2 | Mantis | 螳螂 | 2003-06-26 |
| J2SE | 5.0 | Tiger | 老虎 | 1.5.0 |
| J2SE | 5.1 | Dragonfly | 蜻蜓 | 1.5.1 |
| J2SE | 6.0 | Mustang | 野马 | 1.6.0 |
从JDK1.2.2开始,主要版本(如1.3,1.4,5.0)都是以鸟类或哺乳动物来命名的. 而它们的bug修正版本(如1.2.2,1.3.1,1.4.2)都是以昆虫命名的.
字符 char code 与 unicode 编码的关系
Unicode 编码字符集旨在收集全球所有的字符,为每个字符分配唯一的字符编号即代码点(Code Point),用 U+紧跟着十六进制数表示。所有字符按照使用上的频繁度划分为 17 个平面(编号为 0-16),即基本的多语言平面和增补平面。基本的多语言平面(英文为 Basic Multilingual Plane,简称 BMP)又称平面 0,收集了使用最广泛的字符,代码点从 U+0000 到 U+FFFF,每个平面有 65536 个码点;增补平面从平面 1~16,分为增补多语言平面(平面 1)、增补象形平面(平面 2)、保留平面(平 3~13)、增补专用平面等,每个增补平面也有 power(2, 16) = 65536 个码点。所以 17 个平总计有 17 × 65,536 = 1,114,112 个码点。
unicode 目前普遍采用的编码方式是 UCS-2,使用 2 个字节表示有码点的字符,简而言之就是将每一个字符用 16 位 2 进制数标识,但是通常都用 4 位的 16 进制数标识。javascript 语言采用 unicode 字符集,并使用 UCS-2 编码方法,例如:
- 中文字符串"你好"的 unicode 编码 16 进制表示为:
\u4f60\u597d - 中文字符串"你好"的 unicode 编码 2 进制表示为:
01001111 01100000 01011001 01111101 - 英文字符串"ab"的 unicode 编码 16 进制表示为:
\u0061\u0062 - 英文字符串"ab"的 unicode 编码 2 进制表示为:
00000000 1100001 00000000 1100010
其中\u是标识 unicode 码用的,后面的 4 位 16 进制数则是对应字符的 unicode 码点。
unicode 编码规则
将一个字符(char)的高 8 位与低 8 位分别取出,转化为 16 进制数,如果转化的 16 进制数的长度不足 2 位则补 0,然后将高、低 8 位转成的 16 进制字符串拼接起来并在前面补上
\u即可。