java语言中字符的处理 ----摘要:本文主要讨论了java语言中字符的特殊表达形式,尤其是中文信息的表达处理,阐述了字符处理的关键是要将十六位unicode字符,转换为本地下层平台,也就是运行java虚拟处理机的平台能够理解的字符形式.
----java是一种编程语言.一个运行系统.一套开发工具与一个应用程序编程界面(api).java建立在c++的熟悉.有用的特征之上,而取消了c++的复杂的.危险的与多余的元素.它是一个更安全.更简单.更容易使用的语言. 【程序编程相关:Qmail系统(一)介绍和准备工作】
----关键词:java.字符.8位.16位.unicode字符集 【推荐阅读:java环境设定(为所有初学者)】
----java语言与c语言对字符进行了互不相同的描述,java使用16位的unicode字符集(该标准描述了许多语言的各种不同字符),因此java字符是一个16位的无符号整数,字符变量用来存放单个字符,而不是完整的字符串. 【扩展信息:网页文字框技巧:關閉輸入法.禁止貼上.禁】
1.java的字符表达
----一个字符(character),就是单个字母(letter),许多字母构成一个单词,一组单词组成句子,以此类推.但是对于含有诸如中文信息的字符,就不是那么简单了.
----java的基本的char类型被定义成无符号的16位,它是java中唯一的一个无符号类型.使用16位表达字符的主要原因是要让java能够支持任何unicode字符,因此而使得java适用于描述或显示任何被unicode支持的语言,可移植性也就会更好.但是,能够支持某种语言的字符串显示,与能够正确打印某种语言的字符串,常常是两个不同的问题.由于oak(java最初的代号)开发组的主要环境是unix系统与某些源于unix的系统,所以对开发人员来说,最为方便实用的字符集是isolatin-1.相应地,这一开发组就带有unix遗传性,也就导致了java的i/o系统在很大程度上以unix的流概念为模型,而在unix系统中,每一种i/o设备都是用一串8比特的流来表示.这种在i/o系统方面取模于unix的做法,使得java语言拥有16位的java字符,而却只有8位的输入设备,这样就给java带来了些不足.因此在任何一处java字符串按8位来读入或写出的地方,都得有一小段程序代码,被称为"劈(hack)",来将8位的字符映射成为16位unicode,或将16位的unicode劈成8位字符.
2.问题及解决
----我们要实现从一个文件读取信息,尤其是读取含有中文信息的文件,并将读取到的信息显示在屏幕上,一般我们使用fileinputstream函数打开文件.readchar函数读入字符.如下: import java.io.*;
public class rf{ public static void main(string args[]) { fileinputstream fis; ... 下一页