爱技术

 找回密码
 注册会员

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 570|回复: 7
收起左侧

请教各位高手一个棘手的问题,关于字符编码方面的

[复制链接]
发表于 2007-11-20 22:14:03 | 显示全部楼层 |阅读模式
1000金钱数
这个问题我苦苦思索很久了,一直没有想到有什么解决方案,希望求助于大家的力量 能帮我解决这个难题,非常感谢~~~
(2007-11-20 22:02:52)   H.Z.(10364867)
H.Z.(10364867) 21:59:52
请问有人在吗?请教一个问题
H.Z.(10364867) 22:00:45
如果在一个gb2312或gbk编码的文本里面,将一个文件指针任意滑动到一个随机位置,怎么判断当前字节是一个汉字的后一半或者是前一半呢?
--
附,抛开GBK编码不说,判断是否为西文字符倒是十分简单,但是对于中国这种双字节编码的文本来说,就很有难度了,因为不能提前遍历,给定的条件就是一个随机的位置,所以有可能出现在读取的当前字节为一个汉字编码的首字节(这样为正确的情况),但也有可能为其尾字节(这样势必出现乱码)。在gb2312中汉字编码都是大于0xA0A0的。
当然折中的办法是可以通过肉眼观察法,发现乱码手动偏移一个位置,但目前我很想讨论下自动校正位置的可能性是否可行,谢谢大家!

 楼主| 发表于 2007-11-20 23:05:03 | 显示全部楼层
注:数据不能回溯。
结论:应该是无解,同意的顶

[ 本帖最后由 8226175 于 2007-11-20 23:06 编辑 ]
回复

使用道具 举报

发表于 2007-11-21 00:51:13 | 显示全部楼层
这么专业的东西,直接PM几位高手不就行了吗
回复

使用道具 举报

发表于 2007-11-21 02:19:07 | 显示全部楼层
进来学习学习
回复

使用道具 举报

发表于 2007-11-21 09:37:51 | 显示全部楼层
在奇数插入一个正常汉字。。。然后用字符搜索函数看看能不能找到这个汉字。。。
差不多就是这个思路。。。

[ 本帖最后由 binghelingxi 于 2007-11-21 09:41 编辑 ]
回复

使用道具 举报

发表于 2007-11-21 09:38:42 | 显示全部楼层
:tx


                               
登录/注册后可看大图
到时发钱了不要忘了我啊。。。
回复

使用道具 举报

发表于 2007-11-21 12:26:52 | 显示全部楼层
有个很变态的办法,把整个文件转成Unicode,貌似有个函数可以的,我印象以前在学校这样弄过
回复

使用道具 举报

 楼主| 发表于 2007-11-23 14:16:08 | 显示全部楼层
楼上哦。。。哈哈。就是为了效率嘛,全转换灭意思啊灭意思
怎么还没人同意我的答案啊。。。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册会员 微信登录

本版积分规则

小黑屋|Archiver|手机版|爱技术 ( 沪ICP备08115260号-3 )

GMT+8, 2024-5-2 15:23

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表