一

{"type":"编程笔记"}


  • Home

  • Archives
  • Search

java bin目录下的native2ascii使用

Posted on 2008-06-28   |   In java

直接在命令行中输入native2ascii后可以进入控制台,输入字符串之后native2ascii会将字符串转为unicode编码。

Read more »

delete all .svn directories using linux find command

Posted on 2008-06-19   |   In linux

linux命令批量删除.svn的目录:

Read more »

textmate usefull hotkey

Posted on 2008-06-17   |   In macos

Textmate的几个常用快捷键

Read more »

java已发行的版本及版本名称

Posted on 2008-06-13   |   In java
类型 版本号 名称 中文名 发布日期
JDK 1.1.4 Sparkler 宝石 1997-09-12
JDK 1.1.5 Pumpkin 南瓜 1997-12-13
JDK 1.1.6 Abigail 阿比盖尔--女子名 1998-04-24
JDK 1.1.7 Brutus 布鲁图--古罗马政治家和将军 1998-09-28
JDK 1.1.8 Chelsea 切尔西--城市名 1999-04-08
J2SE 1.2 Playground 运动场 1998-12-04
J2SE 1.2.1 none 无 1999-03-30
J2SE 1.2.2 Cricket 蟋蟀 1999-07-08
J2SE 1.3 Kestrel 美洲红隼 2000-05-08
J2SE 1.3.1 Ladybird 瓢虫 2001-05-17
J2SE 1.4.0 Merlin 灰背隼 2002-02-13
J2SE 1.4.1 grasshopper 蚱蜢 2002-09-16
J2SE 1.4.2 Mantis 螳螂 2003-06-26
J2SE 5.0 Tiger 老虎 1.5.0
J2SE 5.1 Dragonfly 蜻蜓 1.5.1
J2SE 6.0 Mustang 野马 1.6.0

从JDK1.2.2开始,主要版本(如1.3,1.4,5.0)都是以鸟类或哺乳动物来命名的. 而它们的bug修正版本(如1.2.2,1.3.1,1.4.2)都是以昆虫命名的.

Read more »

字符 char code 与 unicode 编码的关系

Posted on 2008-06-10   |   In javascript

Unicode 编码字符集旨在收集全球所有的字符,为每个字符分配唯一的字符编号即代码点(Code Point),用 U+紧跟着十六进制数表示。所有字符按照使用上的频繁度划分为 17 个平面(编号为 0-16),即基本的多语言平面和增补平面。基本的多语言平面(英文为 Basic Multilingual Plane,简称 BMP)又称平面 0,收集了使用最广泛的字符,代码点从 U+0000 到 U+FFFF,每个平面有 65536 个码点;增补平面从平面 1~16,分为增补多语言平面(平面 1)、增补象形平面(平面 2)、保留平面(平 3~13)、增补专用平面等,每个增补平面也有 power(2, 16) = 65536 个码点。所以 17 个平总计有 17 × 65,536 = 1,114,112 个码点。

unicode 目前普遍采用的编码方式是 UCS-2,使用 2 个字节表示有码点的字符,简而言之就是将每一个字符用 16 位 2 进制数标识,但是通常都用 4 位的 16 进制数标识。javascript 语言采用 unicode 字符集,并使用 UCS-2 编码方法,例如:

  1. 中文字符串"你好"的 unicode 编码 16 进制表示为:\u4f60\u597d
  2. 中文字符串"你好"的 unicode 编码 2 进制表示为:01001111 01100000 01011001 01111101
  3. 英文字符串"ab"的 unicode 编码 16 进制表示为:\u0061\u0062
  4. 英文字符串"ab"的 unicode 编码 2 进制表示为:00000000 1100001 00000000 1100010

其中\u是标识 unicode 码用的,后面的 4 位 16 进制数则是对应字符的 unicode 码点。

unicode 编码规则

将一个字符(char)的高 8 位与低 8 位分别取出,转化为 16 进制数,如果转化的 16 进制数的长度不足 2 位则补 0,然后将高、低 8 位转成的 16 进制字符串拼接起来并在前面补上\u即可。

用 java 代码说明 unicode 的编码规则

Read more »
1…757677…99
yuweijun

yuweijun

492 posts
12 categories
RSS
GitHub Twitter
© 2021 yuweijun
Powered by Hexo
Theme - NexT.Mist.KISS