这篇鬼东西是半月半安装freebsd7.0时写下的记录,本想把点时间整理一下,但近来心情不佳,看来是不会去把它完善的。
首先安装完系统,装上KDE
安装显卡驱程是在网上找到的一篇文章上的方法,具体如下:
到nvidia官网上下载对应的最新的驱程
#mkdir /usr/drivers
#mkdir /usr/drivers/elsa660
# tar xzvf NVIDIA-FreeBSD-x86-173.14.09.tar.gz /usr/drivers/elsa660
#cd /usr/drivers/elsa660/NVIDIA-FreeBSD-x86-173.14.09
#make
#make install
后面的步骤要连接网络,我还没有搞定拨号,所以无法继续
我试着从windows系统上上网,下载相应的两个包nvidia-settings.tar.gz和nvidia-xconfig.tar.gz进行手 动安装,不成功,放到/usr/ports/distfiles/下,使用make install clean也没有安装成功。
后来我终于找到拨号的方法,成功地连上网络,可以按照那篇文章的方法继续安装
#sysinstall
选择configure-package-ftp-china-x11
把nvidia-settings-1.0_12和nvidia-xconfig-1.0_1两个装上
删除原来的/etc/X11/xorg.conf
# rm /etc/X11/xorg.conf
照原文的意思是在这里运行nvidia-xconfig,但是我运行时提示没有nvidia命令。无耐我只得使用在freebsd6上的老办法
# Xorg -configure
成功地生成了/root/xorg.conf.new
# cp /root/xorg.conf.new /etc/X11/xorg.conf
在这里我是兴奋过头了,没有修改/etc/ppp/ppp.conf,但当时我并没有相到这一点
新建~/.xinitrc文件,输入下面内容
#!/bin/sh -
export LANG=zh_TW.Big5 #在这里使用zh_TW.Big5是因为我看过这方法的资料都是台湾同胞写的
exec /usr/local/bin/starkde #这里我当时输错了,但是没有发现,应该是exec /usr/local/bin/startkde
结果除了出现一个鼠标之外什么也没有。
在这里我一开始想不到什么解决办法,幸好在我的百度空间上有保存我以前使用的/etc/X11/xorg.conf,我拷贝了下来,看看有什么不同,这才发现要修改Section "Device"项目下的这一行
Driver "nv"
把nv改成nvidia
再次运行startx,
这次看见了nvidia的logo,但是logo过后并没有启动KDE,看了错误信息才知道是找不到命令,最终发现是我把命令输错了,少了个t
重新修改~/.xinitrc文件,使用其内容如下:
#!/bin/sh -
export LANG=zh_TW.Big5
exec /usr/local/bin/startkde
这次成功地进入了KDE,来到选择语言,发现鼠标无法使用,幸好键盘还正常,于是继续进行,我想把语言造成繁体中文,但点击下一步之后,所有的字体都变成了框框,想想英文总比框框好,于是后退,把语言换成英文。顺利地进入了桌面。
为什么鼠标不能使用?我开始以为是/etc/X11/xorg.conf中关于鼠标的设置有问题,但对比以前的/etc/X11/xorg.conf文件发现内容一样。我想起在sysinstall中有可以设置鼠标的项,于是运行
#sysinstall
选择configure,mouse,在里面设置了一下,测试,可以运行鼠标,启动x-window ,可以正常运行鼠标了
因为安装语言包等要用到ports,所以搞定ports再说
设定源
# vi /etc/make.conf
在里面输入如下内容:
MASTER_SITE_BACKUP?= \
ftp://freebsd.csie.ncu.edu.tw/distfiles/${DIST_SUBDIR}/ \
ftp://freebsd.csie.nctu.edu.tw/pub/distfiles/${DIST_SUBDIR}/
ftp://ftp10.tw.freebsd.org/pub/FreeBSD/distfiles/${DIST_SUBDIR}/
ftp://ftp.freebsd.org/pub/FreeBSD/ports/distfiles/${DIST_SUBDIR}/
MASTER_SITE_OVERRIDE?= ${MASTER_SITE_BACKUP}
安装CVSup来保持ports在最新状态
#cd /usr/ports/net/cvsup-without-gui/
#make install clean
接下来我开始汉化KDE,因为教程是以繁体中文为例,所以为图方便,我就使用繁体中文
# cd /usr/ports/chinese/kde3-il8-zh_TW
# make install clean
修改/etc/X11/xorg.conf在Section "Files"项下的 ModulePath "/usr/local/lib/xorg/modules行下加入下面两行
FontPath "/usr/X11R6/lib/X11/fonts/TrueType/"
FontPath "/usr/X11R6/lib/X11/fonts/local/"
保存后运行startx,进入KDE
我为了找到语言设置在“控制中心”找了很久“在kde控制中心的“区域与辅助功能”(Regional&Accessiblity)的国家/地区 语言(Contry/Relang)里面设国家为“china”和语言为“简体中文”(Simplifiled Chinese)”,最终发现图标是一面小国旗的就是设置语言的
我把语言设置成繁体中文,开始上网,发现很多中文网站无法正常显示,看来我认为中简体中文状态下右以正常显示繁体,反过来在繁体下也可以显示简体的想法是错误的,我开始着手安装简体中文包
ctrl+alt+backspace,关闭KDE
安装中文字体kcfont(国乔字体)
#cd /usr/ports/chinese/kcfonts/
#make install clean
arphicttf(文鼎字体)
#cd /usr/ports/chinese/arphicttf/
#make install clean
中文信息档(i18n)
#cd /usr/ports/chinese/kde3-i18n-zh_CN/
#make install clean
汉化KOffice
#cd /usr/ports/chinese/koffice-i18n-zh_CN/
#make install clean
安装五笔输入法
#cd /usr/ports/chinese/scim-tables/
#make install clean
安装拼音输入法
#cd /usr/ports/chinese/scim-pinyin/
#make install clean
还要修改/etc/csh.cshrc文件,在网上很多都是这样写的
cat >> /etc/csh.cshrc << OK
setenv LANG zh_CN.eucCN
setenv LC_CTYPE zh_CN.eucCN
setenv XMODIFIERS @im=SCIM
setenv GTK_IM_MODULE scim
OK
我很佩服这位大哥(我想是男的),他对定向输入很熟悉,完全回避了编辑器,可是我第一次看见这几行的时候我就傻了,我这只菜鸟知道cat命令,也知道>>的意思,但却不知道后面的意思,结果不知道如何是好,真是丢人。
我还是喜欢用vi编辑器
vi /etc/csh.cshrc
在其中输入以下内容
setenv LANG zh_CN.eucCN
setenv LC_CTYPE zh_CN.eucCN
setenv XMODIFIERS @im=SCIM
setenv GTK_IM_MODULE scim
另外在进入X之前需要执行(在~/.xinitrc中加入)
exec scim -d &
此行一定要放在exec /usr/local/bin/startkde之前
运行satrtx,进入KDE,再把字体设置成简体中文,完成。
都说字体不好看,要使用用simsun字体,复制到/usr/X11R6/lib/X11/fonts/TrueType目录下
可从win下复制,win下是simsun.ttc文件
#mount_ntfs -C GBK /dev/设备 /mnt/挂载点
#mkdir -p /usr/X11R6/lib/X11/fonts/TrueType
#cp simsun.ttc /usr/X11R6/lib/X11/fonts/TrueType/simsun.ttf
以前安装的freebsd都是没有声音的,不管我运行dmesg | grep pcm,还是运行 cat /dev/sndstat,都没有显示内容,我还真担心系统不支持我的声卡,我知道我的声卡芯片是SoundMAX,在网上找了一下,居然找到方法:修改 /boot/defaults/loader.conf在loader.conf将snd_hda.ko设置为YES,重启系统,有声了。
有声了就要听听mp3,安装mp3播放器xmms
#cd /usr/ports/multimedia/xmms
#make install clean
#cd /usr/ports/multimedia/xmms-skins
#make install clean
此时的xmms的播放列表无法正常显示中文,要做如下修改
打开xmms,然后,[首选项]>[字体],将playlist变成:-misc-simsun-medium-r-normal-*-*-120-*-*-p-*-gb2312.1980-0",*-r-*
安装完xmms后没有在K菜单中显示出来,要自己设置,可以在“设置”、“菜单编辑器”中设置
安装视频播放器mplayer
# cd /usr/ports/multimedia/mplayer
# make WITH_LANG=zh install clean
安装eva
#cd /usr/ports/net-im/eva
#make install clean
2008-08-28
一些事
行人匆匆在我身边经过
我匆匆在人中穿梭
总觉得我与他们走不到一起
我还是习惯一个人
在我一个人的世界里,
我的悲伤逆流成河。
ps:昨晚居然睡不着,想起这半年前发给小刁的短信。记得那天晚上本来是要去照相的,但走到半路我忽然难过得不行,就发了这样一条短信给小刁。当然小刁是 无法安慰我的,因为我是一个人,孤单的一个人。就那这个空间说吧,没有一个我所认识的人会上这个空间浏览,当然更不会有留言了。虽则也有好友,但都是我加 他们的,而我根本不认识他们,也没有与他们聊过天。
昨晚阿伟发来信息,说要聊天。没理他。今早与他海聊起来。他说他正在追一个166的高妹,明天还被约去吃饭。看来已完全从失恋中走出来。当时他失恋的时候,我写了一篇叫《初恋是什么》的文章,以事记念。
一些事一些情的官方网站loveq已经很多天上不去了,无法下载到我称之为精神食粮的录音,不知道hugo和阿智是不是决定不捞了,很痛苦。改看黄子华的 栋笃笑。觉得这真是个了不起的艺人,内地50年内可能也出不了像这样能讲敢讲《秋前算帐》的人。为纪念这件事,我决定把宠物的名字由“呆呆”改为 “hugo”,传闻中hugo是一个小胖子,正好与它相似。
终于看完了《蒙面之城》,只能说一般吧。
2008-08-27
变笨及在这之后
前几天“鹦鹉”要来的时候觉得自己变笨了,写了以下几句自嘲
最近常想
自己是不是变笨了
想了很久
笑了
这么简单的问题换作以前那用得着想
但这两天我在想我真的比他们差吗?我变得无比绝望。我须要自我安慰一下。
鲁迅先生说的“绝望之为虚妄,正与希望相同”。
最近常想
自己是不是变笨了
想了很久
笑了
这么简单的问题换作以前那用得着想
但这两天我在想我真的比他们差吗?我变得无比绝望。我须要自我安慰一下。
鲁迅先生说的“绝望之为虚妄,正与希望相同”。
完美的menu.lst文件
#没有可能有比这个menu.lst更好的文件了。完美!
# 希锐亚制作 http://hi.baidu.com/xxxcjr
timeout -1
default 0
splashimage (hd0,0)/grub4dos/shanshui.xpm.gz
fontfile (hd0,0)/grub4dos/fonts.gz
title 启动 windows 2003
root (hd0,0)
savedefault
makeactive
chainloader +1
# 这是个启动windows系统的实例
title 启动ubuntu 8.04
rootnoverify (hd0,0)
chainloader (hd0,0)/linux.lnx
boot
# 这是个启动linux系统的实例,是通过linux.lnx引导的
title 启动FreeBSD 6.2
rootnoverify (hd0,1)
chainloader +2
# 这是个启动FreeBSD系统的实例
title 启动老毛桃winPE
map --mem (hd0,0)/grub4dos/winpe/BootCD.ISO (hd32)
map --hook
chainloader (hd32)
boot
# 这是个启动包含winpe的iso的实例
title 启动Puppy Linux
root (hd0,0)
map --mem (hd0,0)/grub4dos/livelinux/puppy-small-barbie-4.0.2.11.iso (hd32)
map --hook
kernel (hd32)/vmlinuz
initrd (hd32)/initrd.gz
boot
# 这是个启动live linux 的iso文件的实例。在所有live linux中Puppy Linux的评价很高,并且中版对中文的支持很好。
title 启动深山红叶DOS工具箱
map --mem (hd0,0)/grub4dos/hydos/dos98.img (fd0)
map --hook
chainloader --disable-a20 (fd0)+1
rootnoverify (fd0)
# 这是个启动非标准软盘映像(大于1.44M)的实例。深山红叶DOS工具箱自带很多很好dos软件。
title 启动Maxdos v6
find --set-root /grub4dos/memdisk.gz
kernel /grub4dos/memdisk.gz c=556 h=2 s=18 floppy
initrd /grub4dos/maxdos/maxdos-v6.img
boot
# 这是个通过memdisk启动非标准软盘映像的实例。maxdos与其它dos映像相比最大的特点是对ntfs格式的支持很好。
title 从 cdrom 启动
cdrom --init
map --hook
chainloader (cd0)
boot
# 这是个从cdrom启动的实例
title 重启
reboot
title 关机
halt
# 希锐亚制作 http://hi.baidu.com/xxxcjr
timeout -1
default 0
splashimage (hd0,0)/grub4dos/shanshui.xpm.gz
fontfile (hd0,0)/grub4dos/fonts.gz
title 启动 windows 2003
root (hd0,0)
savedefault
makeactive
chainloader +1
# 这是个启动windows系统的实例
title 启动ubuntu 8.04
rootnoverify (hd0,0)
chainloader (hd0,0)/linux.lnx
boot
# 这是个启动linux系统的实例,是通过linux.lnx引导的
title 启动FreeBSD 6.2
rootnoverify (hd0,1)
chainloader +2
# 这是个启动FreeBSD系统的实例
title 启动老毛桃winPE
map --mem (hd0,0)/grub4dos/winpe/BootCD.ISO (hd32)
map --hook
chainloader (hd32)
boot
# 这是个启动包含winpe的iso的实例
title 启动Puppy Linux
root (hd0,0)
map --mem (hd0,0)/grub4dos/livelinux/puppy-small-barbie-4.0.2.11.iso (hd32)
map --hook
kernel (hd32)/vmlinuz
initrd (hd32)/initrd.gz
boot
# 这是个启动live linux 的iso文件的实例。在所有live linux中Puppy Linux的评价很高,并且中版对中文的支持很好。
title 启动深山红叶DOS工具箱
map --mem (hd0,0)/grub4dos/hydos/dos98.img (fd0)
map --hook
chainloader --disable-a20 (fd0)+1
rootnoverify (fd0)
# 这是个启动非标准软盘映像(大于1.44M)的实例。深山红叶DOS工具箱自带很多很好dos软件。
title 启动Maxdos v6
find --set-root /grub4dos/memdisk.gz
kernel /grub4dos/memdisk.gz c=556 h=2 s=18 floppy
initrd /grub4dos/maxdos/maxdos-v6.img
boot
# 这是个通过memdisk启动非标准软盘映像的实例。maxdos与其它dos映像相比最大的特点是对ntfs格式的支持很好。
title 从 cdrom 启动
cdrom --init
map --hook
chainloader (cd0)
boot
# 这是个从cdrom启动的实例
title 重启
reboot
title 关机
halt
2008-08-19
2008-08-07
vod_cache_data文件夹
知道迅雷会偷偷上传,但是我还是不知道它的具体做好,网上也没有找到相关的文章。有一篇文章是这样说的:
迅雷上传本机的文件,需要读取存放本地下载信息的文件:C:\WINDOWS\SYSTEM32\cid_store.dat,直接删之即可解决上传问题。如果怕它再次生成的话可以建立一个同名的文件夹。
我不太相信有这么简单。
今天在D盘的根目录和E盘的根目录都发现了一个隐藏的文件夹:vod_cache_data。D盘的vod_cache_data文件夹没有内容,E盘的 vod_cache_data内有一个文件:4D3B3533D8ECC1252E739A6EC13680A8DA43B19A,文件夹内有三个文件: 5674.dat、80620674.dat、vod.cfg。打开是乱码,不过还是有少许可以辨认的中文,我看见我曾经用迅雷下过的一部电影的名字。我的解决方法是使用NTFS权限控制,删除掉所有用户的读写权限。
迅雷上传本机的文件,需要读取存放本地下载信息的文件:C:\WINDOWS\SYSTEM32\cid_store.dat,直接删之即可解决上传问题。如果怕它再次生成的话可以建立一个同名的文件夹。
我不太相信有这么简单。
今天在D盘的根目录和E盘的根目录都发现了一个隐藏的文件夹:vod_cache_data。D盘的vod_cache_data文件夹没有内容,E盘的 vod_cache_data内有一个文件:4D3B3533D8ECC1252E739A6EC13680A8DA43B19A,文件夹内有三个文件: 5674.dat、80620674.dat、vod.cfg。打开是乱码,不过还是有少许可以辨认的中文,我看见我曾经用迅雷下过的一部电影的名字。我的解决方法是使用NTFS权限控制,删除掉所有用户的读写权限。
vod_cache_data是迅雷看看的数据缓存文件夹,这个版本的迅雷会自动选择用户机器剩余空 间最大的分区进行保存,该文件夹从支持迅雷看看的第一个版本就存在,只是放在操作系统的临时目录而已,大家没注意到,现在我们开放了设置,大家可以任意设 置他的所在目录,如果你不使用迅雷看看,那么它里面不会存在数据文件。
——来自迅雷5官方。
双星情歌
2008-08-06
科学的美好(王小波)
科学的美好
作者 王小波
作者 王小波
我原是学理科的,最早学化学。我学得不坏,老师讲的东西我都懂。化学光懂了不成,还要做实验,做实验我就不行了。用移液管移液体,别人都用橡皮球吸液体, 我老用嘴去吸——我知道移液管不能用嘴吸,只是橡皮球经常找不着——吸别的还好,有一回我竟去吸浓氨水,好像吸到了陈年的老尿罐里,此后有半个月嗓子哑掉 了。做毕业论文时,我做个萃取实验,烧瓶里盛了一大瓶子氯仿,滚滚沸腾着,按说不该往外跑,但我的装置漏气,一会儿就漏个精光。漏掉了我就去领新的,新的 一会儿又漏光。一个星期我漏掉了五大瓶氯仿,漏掉的起码有一小半被我吸了进去。这种东西是种麻醉药,我吸进去的氯仿足以醉死十条大蟒。说也奇怪,我居然站 着不倒,只是有点迷糊,在这种情况下,我还把实验做了出来,证明我的化学课学得蛮好。但是老师和同学一致认为我不适合干化学。尤其是和我在一个实验室里做 实验的同学更是这样认为,他们也吸进了一些氯仿,远没我吸得多,却都抱怨说头晕。他们还称我为实验室里的人民公敌。我自己也是这样想的:继续干化学,毒死 我自己还不要紧,毒死同事就不好了。我对这门科学一直恋恋不舍:学化学的女孩很多,有不少长得很漂亮。
后来我去学数学,在这方面我很有天分。无论是数字运算,还是公式推导,我都像闪电一样快,只是结果不一定全对。人家都说,我做起数学题来像小日本一样疯 狂:我们这一代人在银幕上见到的日本人很多,这些人总是头戴战斗帽,挺着刺刀不知死活地冲锋,别人说我做数学题时就是这么个模样。学数学的女孩少,长得也 一般。但学这门科学我害不到别人,所以我也很喜欢。有一回考试,我看看试题,觉得很容易,就像刮风一样做完了走人。等分数出来,居然考了全班的最低分。找 到老师一问,原来那天的试题分为两部分,一半在试题纸的正面,我看到了,也做了。还有一半在反面,我根本就没看见。我赶紧看看这些没做的题,然后说:这些 题目我都会做。老师说,知道你会,但是没做也不能给分。他还说什么“就是要整整你这屁股眼大掉了心的人”。这就是胡说八道了。谁也不能大到了这个地步。一 门课学到了要挨整的程度,就不如不学。
我现在既不是化学家,也不是数学家,更不是物理学家。我靠写文章为生,与科技绝缘——只是有时弄弄计算机。这个行当我会得不少,从最低等的汇编语言到最新 潮的C++全会写,硬件知识也有一些。但从我自己的利益来看,我还不如一点都不会,省得整夜不睡,鼓捣我的电脑,删东加西,最后把整个系统弄垮,手头又没 有软件备份。于是,在凌晨五点钟,我在朋友家门前踱来踱去,抽着烟;早起的清洁工都以为我失恋了,这门里住着我失去的恋人,我在表演失魂落魄给她看。其实 不是的,电脑死掉了,我什么都干不了,更睡不着觉。好容易等到天大亮了,我就冲进去,向他借软件来恢复系统——瞎扯了这么多,现在言归正传。我要说的是: 我和科学没有缘分,但是我爱科学,甚至比真正的科学家还要爱得多些。
正如罗素先生所说,近代以来,科学建立了一种理性的权威——这种权威和以往任何一种权威不同。科学的道理不同于“夫子曰”,也不同于红头文件。科学家发表 的结果,不需要凭借自己的身份来要人相信。你可以拿一支笔,一张纸,或者备几件简单的实验器材,马上就可以验证别人的结论。当然,这是一百年前的事。验证 最新的科学成果要麻烦得多,但是这种原则一点都没有改变。科学和人类其他事业完全不同,它是一种平等的事业。真正的科学没有在中国诞生,这是有原因的。这 是因为中国的文化传统里没有平等:从打孔孟到如今,讲的全是尊卑有序。上面说了,拿煤球炉子可以炼钢,你敢说要做实验验证吗?你不敢。炼出牛屎一样的东 西,也得闭着眼说是好钢。在这种框架之下,根本就不可能有科学。
科学的美好,还在于它是种自由的事业。它有点像它的一个产物互联网(Internet)——谁都没有想建造这样一个全球性的电脑网络,大家只是把各自的网 络连通,不知不觉就把它造成了。科学也是这样的,世界上各地的人把自己的发明贡献给了科学,它就诞生了。这就是科学的实质。还有一样东西也是这么诞生的, 那就是市场经济。做生意的方法,你发明一些,我发明一些,慢慢地形成了现在这个东西,你看它不怎么样,但它还无可替代。一种自由发展而成的事业,总是比个 人能想出来的强大得多。参与自由的事业,像做自由的人一样,令人神往。当然,扯到这里就离了题。现在总听到有人说,要有个某某学,或者说,我们要创建有民 族风格的某某学,仿佛经他这么一规划、一呼吁,在他画出的框子里就会冒出一种真正的科学。老母鸡“格格”地叫一阵,挣红了脸,就能生一个蛋,但科学不会这 样产生。人会情绪激动,又会爱慕虚荣。科学没有这些毛病,对人的这些毛病,它也不予回应。最重要的是:科学就是它自己,不在任何人的管辖之内。
对于科学的好处,我已经费尽心机阐述了一番,当然不可能说得全面。其实我最想说的是:科学是人创造的事业,但它比人类本身更为美好。我的老师说过,科学对 中国人来说,是种外来的东西,所以我们对它的理解,有过种种偏差:始则惊为洪水猛兽,继而当巫术去理解,再后来把它看作一种宗教,拜倒在它的面前。他说这 些理解都是不对的,科学是个不断学习的过程。我老师说得很对。我能补充的只是:除了学习科学已有的内容,还要学习它所有、我们所无的素质。我现在不学科学 了,但我始终在学习这些素质。这就是说,人要爱平等、爱自由,人类开创的一切事业中,科学最有成就,就是因为有这两样做根基。对个人而言,没有这两样东 西,不仅淡不上成就,而且会活得像一只猪。比这还重要的只有一样,就是要爱智慧。无论是个人,还是民族,做聪明人才有前途,当笨蛋肯定是要倒霉。大概是在 一年多以前吧,我写了篇小文章讨论这个问题,论证人爱智慧比当笨蛋好些。结果冒出一位先生把我臭骂一顿,还说我不爱国——真是好没来由!我只是论证一番, 又没强逼着你当聪明人。你爱当笨蛋就去当吧,你有这个权利。
本篇最初发表于1997年第1期《金秋科苑》杂志。发表时题目为“向科学学习什么”。——编者
[转]中文字符集与字符编码的基础知识
安装freebsd时遇到字条编码的问题,即在ubuntu可以正常地显示windows,freebsd系统上的文字,但在freebsd刚不能,找了下面这篇学习一下。
-----------------------------------------------
中文字符集与字符编码的基础知识
字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常 见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB 18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。
中文文字数目大,而且还分为简体中文和繁体中文两种不同书写规则的文字,而计算机最初是按英语单字节字符设计的,因此,对中文字符进行编码,是中文信息交 流的技术基础。本文将按照字符集的时间顺序讨论几种典型的字符集,选取几种代表性的中文字符集,研究历史由来、特点、技术特征。
ASCII 字符集
1.名称的由来
ASCII(American Standard Code for Information Interchange,美国信息互换标准代码)是基于罗马字母表的一套电脑编码系统。 www.444p.com php学习之家
2.特点
它主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO 646。
3.包含内容
控制字符:回车键、退格、换行键等。
可显示字符:英文大小写字符、阿拉伯数字和西文符号
4.技术特征
7位(bits)表示一个字符,共128字符
5.ASCII扩展字符集
7位编码的字符集只能支持128个字符,为了表示更多的欧洲常用字符对ASCII进行了扩展,ASCII扩展字符集使用8位(bits)表示一个字符,共256字符。
ASCII扩展字符集比ASCII字符集扩充出来的符号包括表格符号、计算符号、希腊字母和特殊的拉丁符号。
GB2312 字符集
1.名称的由来
GB2312又称为GB2312-80字符集,全称为《信息交换用汉字编码字符集·基本集》,由原中国国家标准总局发布,1981年5月1日实施。 www.444p.com
2.特点
GB2312是中国国家标准的简体中文字符集。它所收录的汉字已经覆盖99.75%的使用频率,基本满足了汉字的计算机处理需要。在中国大陆和新加坡获广泛使用。
3.包含内容
GB2312 收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。其中包括 6763个汉字,其中一级汉字3755个,二级汉字3008个;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字 符。
4.技术特征
(1)分区表示:
GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。
各区包含的字符如下:01-09区为特殊符号;16-55区为一级汉字,按拼音排序;56-87区为二级汉字,按部首/笔画排序;10-15区及88-94区则未有编码。 php学习之家
(2)双字节表示
两个字节中前面的字节为第一字节,后面的字节为第二字节。习惯上称第一字节为“高字节” ,而称第二字节为“低字节”。
“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。
5.编码举例
以GB2312字符集的第一个汉字“啊”字为例,它的区号16,位号01,则区位码是1601,在大多数计算机程序中,高字节和低字节分别加0xA0得到程序的汉字处理编码0xB0A1。计算公式是:0xB0=0xA0+16, 0xA1=0xA0+1。
BIG5 字符集
1.名称的由来
又称大五码或五大码,1984年由台湾财团法人信息工业策进会和五间软件公司宏碁 (Acer)、神通 (MiTAC)、佳佳、零壹 (Zero One)、大众 (FIC)创立,故称大五码。
Big5码的产生,是因为当时台湾不同厂商各自推出不同的编码,如倚天码、IBM PS55、王安码等,彼此不能兼容;另一方面,台湾政府当时尚未推出官方的汉字编码,而中国大陆的GB2312编码亦未有收录繁体中文字。 php学习之家http://www.444p.com
2.特点
Big5字符集共收录13,053个中文字,该字符集在中国台湾使用。耐人寻味的是该字符集重复地收录了两个相同的字:“兀”(0xA461及0xC94A)、“嗀”(0xDCD1及0xDDFC)。
3.字符编码方法
Big5码使用了双字节储存方法,以两个字节来编码一个字。第一个字节称为“高位字节”,第二个字节称为“低位字节”。高位字节的编码范围0xA1-0xF9,低位字节的编码范围0x40-0x7E及0xA1-0xFE。
各编码范围对应的字符类型如下:0xA140-0xA3BF为标点符号、希腊字母及特殊符号,另外于0xA259-0xA261,存放了双音节度量衡单位 用字:兙兛兞兝兡兣嗧瓩糎;0xA440-0xC67E为常用汉字,先按笔划再按部首排序;0xC940-0xF9D5为次常用汉字,亦是先按笔划再按部 首排序。
4.Big5 的局限性
尽管Big5码内包含一万多个字符,但是没有考虑社会上流通的人名、地名用字、方言用字、化学及生物科等用字,没有包含日文平假名及片假名字母。
www.444p.com
例如台湾视“着”为“著”的异体字,故没有收录“着”字。康熙字典中的一些部首用字(如“亠”、“疒”、“辵”、“癶”等)、常见的人名用字(如“堃”、“煊”、“栢”、“喆”等) 也没有收录到Big5之中。
GB18030 字符集
1.名称的由来
GB 18030的全称是GB18030-2000《信息交换用汉字编码字符集基本集的扩充》,是我国政府于2000年3月17日发布的新的汉字编码国家标准,2001年8月31日后在中国市场上发布的软件必须符合本标准
2.特点
GB 18030字符集标准的出台经过广泛参与和论证,来自国内外知名信息技术行业的公司,信息产业部和原国家质量技术监督局联合实施。
GB 18030 字符集标准解决汉字、日文假名、朝鲜语和中国少数民族文字组成的大字符集计算机编码问题。该标准的字符总编码空间超过150万个编码位,收录了27484 个汉字,覆盖中文、日文、朝鲜语和中国少数民族文字。满足中国大陆、香港、台湾、日本和韩国等东亚地区信息交换多文种、大字量、多用途、统一编码格式的要 求。并且与Unicode 3.0版本兼容,填补Unicode扩展字符字汇“统一汉字扩展A”的内容。并且与以前的国家字符编码标准(GB2312,GB13000.1)兼容。 php学习之家
3.编码方法
GB 18030 标准采用单字节、双字节和四字节三种方式对字符编码。单字节部分使用0×00至0×7F码(对应于ASCII码的相应码)。双字节部分,首字节码从 0×81至0×FE,尾字节码位分别是0×40至0×7E和0×80至0×FE。四字节部分采用GB/T 11383未采用的0×30到0×39作为对双字节编码扩充的后缀,这样扩充的四字节编码,其范围为0×81308130到0×FE39FE39。其中第 一、三个字节编码码位均为0×81至0×FE,第二、四个字节编码码位均为0×30至0×39。
4.包含的内容
双字节部分收录内容主要包括GB13000.1全部CJK汉字20902个、有关标点符号、表意文字描述符13个、增补的汉字和部首/构件80个、双字节 编码的欧元符号等。 四字节部分收录了上述双字节字符之外的,包括CJK统一汉字扩充A在内的GB 13000.1中的全部字符。
Unicode字符集
1.名称的由来
Unicode 字符集编码是Universal Multiple-Octet Coded Character Set 通用多八位编码字符集的简称,是由一个名为 Unicode 学术学会(Unicode Consortium)的机构制订的字符编码系统,支持现今世界各种不同语言的书面文本的交换、处理及显示。该编码于1990年开始研发,1994年正式 公布,最新版本是2005年3月31日的Unicode 4.1.0。
php学习之家
2.特征
Unicode是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
3.编码方法
Unicode 标准始终使用十六进制数字,而且在书写时在前面加上前缀“U+”,例如字母“A”的编码为 004116 和字符“ ”的编码为 20AC16。所以“A”的编码书写为“U+0041”。
4.UTF-8 编码
UTF-8是Unicode的其中一个使用方式。 UTF是 Unicode Translation Format,即把Unicode转做某种格式的意思。
UTF-8便于不同的计算机之间使用网络传输不同语言和编码的文字,使得双字节的Unicode能够在现存的处理单字节的系统上正确传输。
UTF-8使用可变长度字节来储存 Unicode字符,例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节。 www.444p.com
5.UTF-16 和 UTF-32 编码
UTF- 32、UTF-16 和 UTF-8 是 Unicode 标准的编码字符集的字符编码方案,UTF-16 使用一个或两个未分配的 16 位代码单元的序列对 Unicode 代码点进行编码;UTF-32 即将每一个 Unicode 代码点表示为相同值的 32 位整数。
-----------------------------------------------
中文字符集与字符编码的基础知识
字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常 见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB 18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。
中文文字数目大,而且还分为简体中文和繁体中文两种不同书写规则的文字,而计算机最初是按英语单字节字符设计的,因此,对中文字符进行编码,是中文信息交 流的技术基础。本文将按照字符集的时间顺序讨论几种典型的字符集,选取几种代表性的中文字符集,研究历史由来、特点、技术特征。
ASCII 字符集
1.名称的由来
ASCII(American Standard Code for Information Interchange,美国信息互换标准代码)是基于罗马字母表的一套电脑编码系统。 www.444p.com php学习之家
2.特点
它主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO 646。
3.包含内容
控制字符:回车键、退格、换行键等。
可显示字符:英文大小写字符、阿拉伯数字和西文符号
4.技术特征
7位(bits)表示一个字符,共128字符
5.ASCII扩展字符集
7位编码的字符集只能支持128个字符,为了表示更多的欧洲常用字符对ASCII进行了扩展,ASCII扩展字符集使用8位(bits)表示一个字符,共256字符。
ASCII扩展字符集比ASCII字符集扩充出来的符号包括表格符号、计算符号、希腊字母和特殊的拉丁符号。
GB2312 字符集
1.名称的由来
GB2312又称为GB2312-80字符集,全称为《信息交换用汉字编码字符集·基本集》,由原中国国家标准总局发布,1981年5月1日实施。 www.444p.com
2.特点
GB2312是中国国家标准的简体中文字符集。它所收录的汉字已经覆盖99.75%的使用频率,基本满足了汉字的计算机处理需要。在中国大陆和新加坡获广泛使用。
3.包含内容
GB2312 收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。其中包括 6763个汉字,其中一级汉字3755个,二级汉字3008个;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字 符。
4.技术特征
(1)分区表示:
GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。
各区包含的字符如下:01-09区为特殊符号;16-55区为一级汉字,按拼音排序;56-87区为二级汉字,按部首/笔画排序;10-15区及88-94区则未有编码。 php学习之家
(2)双字节表示
两个字节中前面的字节为第一字节,后面的字节为第二字节。习惯上称第一字节为“高字节” ,而称第二字节为“低字节”。
“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。
5.编码举例
以GB2312字符集的第一个汉字“啊”字为例,它的区号16,位号01,则区位码是1601,在大多数计算机程序中,高字节和低字节分别加0xA0得到程序的汉字处理编码0xB0A1。计算公式是:0xB0=0xA0+16, 0xA1=0xA0+1。
BIG5 字符集
1.名称的由来
又称大五码或五大码,1984年由台湾财团法人信息工业策进会和五间软件公司宏碁 (Acer)、神通 (MiTAC)、佳佳、零壹 (Zero One)、大众 (FIC)创立,故称大五码。
Big5码的产生,是因为当时台湾不同厂商各自推出不同的编码,如倚天码、IBM PS55、王安码等,彼此不能兼容;另一方面,台湾政府当时尚未推出官方的汉字编码,而中国大陆的GB2312编码亦未有收录繁体中文字。 php学习之家http://www.444p.com
2.特点
Big5字符集共收录13,053个中文字,该字符集在中国台湾使用。耐人寻味的是该字符集重复地收录了两个相同的字:“兀”(0xA461及0xC94A)、“嗀”(0xDCD1及0xDDFC)。
3.字符编码方法
Big5码使用了双字节储存方法,以两个字节来编码一个字。第一个字节称为“高位字节”,第二个字节称为“低位字节”。高位字节的编码范围0xA1-0xF9,低位字节的编码范围0x40-0x7E及0xA1-0xFE。
各编码范围对应的字符类型如下:0xA140-0xA3BF为标点符号、希腊字母及特殊符号,另外于0xA259-0xA261,存放了双音节度量衡单位 用字:兙兛兞兝兡兣嗧瓩糎;0xA440-0xC67E为常用汉字,先按笔划再按部首排序;0xC940-0xF9D5为次常用汉字,亦是先按笔划再按部 首排序。
4.Big5 的局限性
尽管Big5码内包含一万多个字符,但是没有考虑社会上流通的人名、地名用字、方言用字、化学及生物科等用字,没有包含日文平假名及片假名字母。
www.444p.com
例如台湾视“着”为“著”的异体字,故没有收录“着”字。康熙字典中的一些部首用字(如“亠”、“疒”、“辵”、“癶”等)、常见的人名用字(如“堃”、“煊”、“栢”、“喆”等) 也没有收录到Big5之中。
GB18030 字符集
1.名称的由来
GB 18030的全称是GB18030-2000《信息交换用汉字编码字符集基本集的扩充》,是我国政府于2000年3月17日发布的新的汉字编码国家标准,2001年8月31日后在中国市场上发布的软件必须符合本标准
2.特点
GB 18030字符集标准的出台经过广泛参与和论证,来自国内外知名信息技术行业的公司,信息产业部和原国家质量技术监督局联合实施。
GB 18030 字符集标准解决汉字、日文假名、朝鲜语和中国少数民族文字组成的大字符集计算机编码问题。该标准的字符总编码空间超过150万个编码位,收录了27484 个汉字,覆盖中文、日文、朝鲜语和中国少数民族文字。满足中国大陆、香港、台湾、日本和韩国等东亚地区信息交换多文种、大字量、多用途、统一编码格式的要 求。并且与Unicode 3.0版本兼容,填补Unicode扩展字符字汇“统一汉字扩展A”的内容。并且与以前的国家字符编码标准(GB2312,GB13000.1)兼容。 php学习之家
3.编码方法
GB 18030 标准采用单字节、双字节和四字节三种方式对字符编码。单字节部分使用0×00至0×7F码(对应于ASCII码的相应码)。双字节部分,首字节码从 0×81至0×FE,尾字节码位分别是0×40至0×7E和0×80至0×FE。四字节部分采用GB/T 11383未采用的0×30到0×39作为对双字节编码扩充的后缀,这样扩充的四字节编码,其范围为0×81308130到0×FE39FE39。其中第 一、三个字节编码码位均为0×81至0×FE,第二、四个字节编码码位均为0×30至0×39。
4.包含的内容
双字节部分收录内容主要包括GB13000.1全部CJK汉字20902个、有关标点符号、表意文字描述符13个、增补的汉字和部首/构件80个、双字节 编码的欧元符号等。 四字节部分收录了上述双字节字符之外的,包括CJK统一汉字扩充A在内的GB 13000.1中的全部字符。
Unicode字符集
1.名称的由来
Unicode 字符集编码是Universal Multiple-Octet Coded Character Set 通用多八位编码字符集的简称,是由一个名为 Unicode 学术学会(Unicode Consortium)的机构制订的字符编码系统,支持现今世界各种不同语言的书面文本的交换、处理及显示。该编码于1990年开始研发,1994年正式 公布,最新版本是2005年3月31日的Unicode 4.1.0。
php学习之家
2.特征
Unicode是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
3.编码方法
Unicode 标准始终使用十六进制数字,而且在书写时在前面加上前缀“U+”,例如字母“A”的编码为 004116 和字符“ ”的编码为 20AC16。所以“A”的编码书写为“U+0041”。
4.UTF-8 编码
UTF-8是Unicode的其中一个使用方式。 UTF是 Unicode Translation Format,即把Unicode转做某种格式的意思。
UTF-8便于不同的计算机之间使用网络传输不同语言和编码的文字,使得双字节的Unicode能够在现存的处理单字节的系统上正确传输。
UTF-8使用可变长度字节来储存 Unicode字符,例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节。 www.444p.com
5.UTF-16 和 UTF-32 编码
UTF- 32、UTF-16 和 UTF-8 是 Unicode 标准的编码字符集的字符编码方案,UTF-16 使用一个或两个未分配的 16 位代码单元的序列对 Unicode 代码点进行编码;UTF-32 即将每一个 Unicode 代码点表示为相同值的 32 位整数。
边界
网络很大,但不是没有边界,网上有很多东西,花一辈子的时光也看不完,但却不一定能找到你要找的东西。
想起周润发的《监狱风云》中的那首《友谊之光》,找到了,下载下来听。
想起《倩女幽魂》中午马的那首《道道道》,找不到,只能找到歌词。
(白)人间道
道道道道道道
道道道道道道道道道
道可道非常道
天道地道人道剑道
黑道白道黄道赤道
乜道物道道道都道
自己嗰道系非常道
呸呸呸呸呸胡说八道
no no no no no 胡说八道
呢度嗰度边度系路(笑)哈哈
花道茶道哈阴道阳道哈
零度密度咸度淡度光度热度雷射角度
鬼哭神号旁门左道狗上瓦坑必然有路
你度佢度豺狼当道唏我自求我道
我自求我道
海底隧道天后庙道皇后大道罗便臣道
马头围道牛头角道金马伦道铜锣湾道
条条大道条条系路
哈我自求我道
我自求我道
道可道非常道
天道地道人道剑道
一道二道三道四道
东道南道西道北道
左道右道前路后路
都都都都都系胡说八道
呢度嗰度
边度系路(笑)哈哈
花道茶道哈阴道阳道哈
零度密度咸度淡度光度热度雷射角度
鬼哭神号旁门左道狗上瓦坑必然有路
你度佢度豺狼当道唏
各自求各道
各自求各道
blogger可以访问了,维基百科可以访问了,开放,自由当然是好事,但我不认为开放一个挑骨头的政治网站比开放一个生活论坛更有意思。
想起周润发的《监狱风云》中的那首《友谊之光》,找到了,下载下来听。
想起《倩女幽魂》中午马的那首《道道道》,找不到,只能找到歌词。
(白)人间道
道道道道道道
道道道道道道道道道
道可道非常道
天道地道人道剑道
黑道白道黄道赤道
乜道物道道道都道
自己嗰道系非常道
呸呸呸呸呸胡说八道
no no no no no 胡说八道
呢度嗰度边度系路(笑)哈哈
花道茶道哈阴道阳道哈
零度密度咸度淡度光度热度雷射角度
鬼哭神号旁门左道狗上瓦坑必然有路
你度佢度豺狼当道唏我自求我道
我自求我道
海底隧道天后庙道皇后大道罗便臣道
马头围道牛头角道金马伦道铜锣湾道
条条大道条条系路
哈我自求我道
我自求我道
道可道非常道
天道地道人道剑道
一道二道三道四道
东道南道西道北道
左道右道前路后路
都都都都都系胡说八道
呢度嗰度
边度系路(笑)哈哈
花道茶道哈阴道阳道哈
零度密度咸度淡度光度热度雷射角度
鬼哭神号旁门左道狗上瓦坑必然有路
你度佢度豺狼当道唏
各自求各道
各自求各道
blogger可以访问了,维基百科可以访问了,开放,自由当然是好事,但我不认为开放一个挑骨头的政治网站比开放一个生活论坛更有意思。
订阅:
博文 (Atom)