unicode.c 7.7 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355
  1. #include "includes.h"
  2. #include "unicode.h"
  3. #include <stdint.h>
  4. #include <string.h>
  5. #include <stdlib.h>
  6. #include <stdio.h>
  7. #define GB2312_TO_UNICODE_BASE 0x134000 //起始地址?
  8. #define UNICODE_TO_GB2312_BASE 0x138000
  9. extern const uint16_t GB2312_UNICODE_MAP[];
  10. //extern unsigned short giGB2312[21243][2];
  11. //const unsigned short giGBCount=21243;
  12. typedef struct {
  13. uint16_t unicode;
  14. uint16_t gb2312;
  15. } unicode_gb2312_map_t;
  16. extern const unicode_gb2312_map_t UNICODE_GB2312_MAP[];
  17. /*
  18. MIN_CODE = $A1A1;
  19. MAX_CODE = $F7FE;
  20. */
  21. #define GB2312_CODE_ZONE_MIN 0xA1
  22. #define GB2312_CODE_ZONE_MAX 0xF7
  23. #define GB2312_CODE_POS_MIN 0xA1
  24. #define GB2312_CODE_POS_MAX 0xFE
  25. uint16_t
  26. GB2312_to_Unicode(uint16_t c)
  27. {
  28. uint8_t zone, pos;
  29. uint32_t offset;
  30. uint16_t retval;
  31. // printf("%2x/r",c);
  32. zone = c >> 8;
  33. pos = c & 0xFF;
  34. // printf("%2x-/r",zone);
  35. // printf("%2x--/r",pos);
  36. if ((zone > GB2312_CODE_ZONE_MAX) ||
  37. (zone < GB2312_CODE_ZONE_MIN) ||
  38. (pos > GB2312_CODE_POS_MAX) ||
  39. (pos < GB2312_CODE_POS_MIN))
  40. {
  41. return c;
  42. }
  43. offset = (zone - GB2312_CODE_ZONE_MIN) * (GB2312_CODE_POS_MAX - GB2312_CODE_POS_MIN + 1) +
  44. (pos - GB2312_CODE_POS_MIN);
  45. //spiFlashBlockRead(GB2312_TO_UNICODE_BASE + offset * 2, (uint8_t *)&retval, 2);
  46. retval=GB2312_UNICODE_MAP[offset];//offset*2
  47. return retval;
  48. }
  49. uint16_t
  50. Unicode_to_GB2312(uint16_t c)
  51. {
  52. int offset;
  53. int low, high, mid;
  54. //const unicode_gb2312_map_t *map;
  55. unicode_gb2312_map_t map;
  56. if (((c >> 8) == 0) && ((c & 0xFF) < 0x7F))
  57. {
  58. return c;
  59. }
  60. low = 0;
  61. high = (GB2312_CODE_ZONE_MAX - GB2312_CODE_ZONE_MIN + 1) *
  62. (GB2312_CODE_POS_MAX - GB2312_CODE_POS_MIN + 1);
  63. while (low <= high)
  64. {
  65. mid = (low + high) / 2;
  66. // spiFlashBlockRead(UNICODE_TO_GB2312_BASE + mid * sizeof(unicode_gb2312_map_t),
  67. // (uint8_t *)&map, sizeof(unicode_gb2312_map_t));
  68. //map = UNICODE_GB2312_MAP[mid];
  69. //ReadFileData(int FileIndex,u32 startAddr,u32 readLen,unsigned char *pData)
  70. ReadFileData(UniToGBKIndex, mid * sizeof(unicode_gb2312_map_t),sizeof(unicode_gb2312_map_t),(uint8_t *)&map);
  71. if (c > map.unicode)
  72. {
  73. low = mid + 1;
  74. }
  75. if (c < map.unicode)
  76. {
  77. high = mid - 1;
  78. }
  79. if (c == map.unicode)
  80. {
  81. return map.gb2312;
  82. }
  83. }
  84. return '?'; // 无法识别,替换为 ?
  85. }
  86. uint16_t
  87. Ansi_to_Unicode(uint16_t *dest, uint16_t size, const uint8_t *src, uint16_t length) //GBK_Unicode
  88. {
  89. uint16_t count = 0;
  90. while((count < size) && length)
  91. {
  92. if ((*src > 0x7F) && (length > 1))
  93. {
  94. dest[count] = GB2312_to_Unicode(((uint16_t)src[0] << 8) | src[1]);
  95. src += 2;
  96. length -= 2;
  97. }
  98. else
  99. {
  100. dest[count] = *src;
  101. src++;
  102. length--;
  103. }
  104. ++count;
  105. }
  106. return count;
  107. }
  108. uint16_t
  109. Unicode_to_Ansi(uint8_t *dest, uint16_t size, const uint8_t *src, uint16_t length) //
  110. {
  111. uint16_t count = 0;
  112. uint16_t t;
  113. while((count + 1 < size) && length)
  114. {
  115. t = Unicode_to_GB2312(((uint16_t)src[1] << 8) | src[0]);
  116. if ((t >> 8) == 0)
  117. {
  118. *dest++ = t;
  119. ++count;
  120. }
  121. else
  122. {
  123. *dest++ = t >> 8;
  124. *dest++ = t;
  125. count += 2;
  126. }
  127. src += 2;
  128. length -= 2;
  129. }
  130. *dest++ = 0;
  131. return count;
  132. }
  133. /**************************************************************************************
  134. 将字符形式的Unicode转为Ansi
  135. 比如:字符串“d89ea48ba47fc47e0000”将转为 "默认群组"
  136. ***************************************************************************************/
  137. uint16_t StrUnicodeToAnsi(uint8_t *dest,uint16_t size,const char *src)
  138. {
  139. uint16_t count = 0;
  140. uint16_t t;
  141. int length;
  142. uint16_t v;
  143. char temp[5];
  144. length=strlen(src);
  145. if(length<4) return 0;
  146. memset(dest,0,size);
  147. while((count + 1 < size) && length>0)
  148. {
  149. // temp[0]=src[2];temp[1]=src[3]; //{0x00A4, 0xA1E8},00A4 其实要变成A400 倒过来
  150. // temp[2]=src[0];temp[3]=src[1];
  151. // temp[4]=0;
  152. temp[0]=src[0];temp[1]=src[1]; //{0x00A4, 0xA1E8},00A4 其实要变成A400 倒过来
  153. temp[2]=src[2];temp[3]=src[3];
  154. temp[4]=0;
  155. v=strtol(temp,NULL,16);
  156. t = Unicode_to_GB2312(v);
  157. if ((t >> 8) == 0)
  158. {
  159. *dest++ = t;
  160. ++count;
  161. }
  162. else
  163. {
  164. *dest++ = t >> 8;
  165. *dest++ = t;
  166. count += 2;
  167. }
  168. src += 4;
  169. length -= 4;
  170. }
  171. *dest++ = 0;
  172. return count;
  173. }
  174. /**************************************************************************************
  175. 将字符串转字符串形式的StrUnicode
  176. 比如:字符串"默认群组"(8字节) 转为 “d89ea48ba47fc47e”(16字节)默认群组的Unicode就是
  177. d89ea48ba47fc47e {0x6DF1, 0xC9EE},
  178. ***************************************************************************************/
  179. //uint16_t
  180. //GB_to_UN(uint16_t c)
  181. //{
  182. // uint8_t zone, pos;
  183. // int offset;
  184. // int low, high, mid;
  185. // const unicode_gb2312_map_t *map;
  186. // if (((c >> 8) == 0) && ((c & 0xFF) < 0x7F))
  187. // {
  188. // return c;
  189. // }
  190. // printf("%2x--/r",c);
  191. // low = 0;
  192. // high = (GB2312_CODE_ZONE_MAX - GB2312_CODE_ZONE_MIN + 1) * //8178
  193. // (GB2312_CODE_POS_MAX - GB2312_CODE_POS_MIN + 1);
  194. // while (low <= high)
  195. // {
  196. // mid = (low + high) / 2;
  197. // map = &UNICODE_GB2312_MAP[mid];
  198. //
  199. // if (c > map->gb2312)
  200. // {
  201. // low = mid + 1;
  202. // }
  203. // if (c < map->gb2312)
  204. // {
  205. // high = mid - 1;
  206. // }
  207. // if (c == map->gb2312)
  208. // {
  209. // return map->unicode;
  210. // }
  211. // }
  212. // return '?'; // 无法识别,替换为 ?
  213. //}
  214. ///**************************************************************************/
  215. //uint16_t AnsiToStrUnicode(uint16_t *dest,uint16_t size,const char *src)
  216. //{
  217. // uint16_t count = 0;
  218. // uint16_t t;
  219. // int length;
  220. // uint16_t v;
  221. // char temp[5];
  222. //
  223. //
  224. // length=strlen(src);
  225. // if(length<2) return 0; //因为后面只留2个0 c9eedbdab0eccac2b4a6 00
  226. // memset(dest,0,size);
  227. // printf("%2x/n-->",*src);
  228. //
  229. // while((count < size) && length>0)
  230. // {
  231. // temp[0]=src[0];temp[1]=src[1]; //{0x6DF1, 0xC9EE},
  232. // temp[2]=src[2];temp[3]=src[3];
  233. // temp[4]=0;
  234. // v=strtol(temp,NULL,16);
  235. // printf("%2x/n->",v);
  236. // if ((v > 0x7F)&& (length > 1)) //(*src > 0x7F) &&
  237. // {
  238. // dest[count] = GB_to_UN(v);
  239. // printf("%2x/n/r",dest[count]);
  240. // src += 4;
  241. // length -= 4;
  242. // }else{
  243. // dest[count] = *src;
  244. // src++;
  245. // length--;
  246. //
  247. // }
  248. // ++count;
  249. // }
  250. //
  251. // return count;
  252. //}
  253. /********************************************************************************/
  254. uint16_t AnsiToStrUnicode(uint16_t *dest,uint16_t size,const char *src)
  255. {
  256. #if 1
  257. uint16_t count = 0;
  258. uint16_t t,v;
  259. int length;
  260. char temp[5];
  261. unsigned char t1,t2;
  262. length=strlen(src);
  263. if(length<2) return 0; //因为后面只留2个0 c9eedbdab0eccac2b4a6 00
  264. memset(dest,0,size); //初始化目标
  265. while((count < size) && length)
  266. {
  267. if(src[0] == 0x30 && src[1] == 0x30) return count;
  268. temp[0]=src[0];temp[1]=src[1];
  269. temp[2]=src[2];temp[3]=src[3];
  270. temp[4]=0;
  271. v=strtol(temp,NULL,16);
  272. t1=v&0xff;
  273. t2=(v>>8)&0xff;
  274. if((t1 > 0x7F) && (t2 > 0x7f) && (length > 1))
  275. {
  276. dest[count] = GB2312_to_Unicode(v);
  277. src += 4;
  278. length -= 4;
  279. }
  280. else
  281. {
  282. t=t2;
  283. t &= 0xff;
  284. dest[count] = t;
  285. src +=2;
  286. length -=2;
  287. }
  288. ++count;
  289. }
  290. return 0;
  291. #else
  292. uint16_t count = 0;
  293. uint16_t t,v;
  294. int length;
  295. char temp[5];
  296. length=strlen(src);
  297. if(length<2) return 0; //因为后面只留2个0 c9eedbdab0eccac2b4a6 00
  298. memset(dest,0,size); //初始化目标
  299. g_GroupNameLen=0;
  300. // printf("%2x/n-->",*src);
  301. while((count < size) && length)
  302. {
  303. temp[0]=src[0];temp[1]=src[1];
  304. temp[2]=src[2];temp[3]=src[3];
  305. temp[4]=0;
  306. v=strtol(temp,NULL,16);
  307. // printf("%2x/n->",v);
  308. if(v!=0){g_GroupNameLen++;}else{return 0;}
  309. if ((v > 0x7F)&&((v>>8) > 0x7F) && (length > 1)) // if ((v > 0x7F)&& (length > 1))
  310. {
  311. dest[count] = GB2312_to_Unicode(v);
  312. // printf("%2x/n/r", dest[count]);
  313. src += 4;
  314. length -= 4;
  315. }
  316. else
  317. {
  318. dest[count] = *src;
  319. src++;
  320. length--;
  321. }
  322. ++count;
  323. }
  324. return 0;
  325. #endif
  326. }