Dev Talk - Hide_D군님, CCustomDic2 의 문제점을 알 것 같습니다..

글 수 429

Hide_D군님, CCustomDic2 의 문제점을 알 것 같습니다..

whoami

저번에 (5) 문제.. 기억하시나요?

아마도 이것 때문인 것 같습니다.

void CCustomDic2::PreCustomDic(LPSTR Dest, LPCSTR Source)
{
    // ... 전략
    for(int head=0;head<SourceLen;head++)
    {
          for(int tail=SourceLen-1;tail>head;tail--)
         {
              // ... 중략 ...

             //2바이트 처리, 수행속도 향상용
             if((BYTE)Source[tail]>0x80){
                   tail--;
             }
         }
         //2바이트 처리, 수행속도 향상용
         if((BYTE)Source[head]>0x80){
              //전각문자라면
              head++;
         }
    }
    Temp+=string(Source,SPoint,SourceLen-SPoint); //마무리
}

저기 빨간 부분..
MBCS 에서는 절대 뒤에서 앞으로 탐색하시면 안됩니다. 특히, 일본어인 경우 더 그렇습니다.

일본어 (Shift-JIS) 의 경우, 리드바이트는 81-9F, E0-EE 까지, 트레일바이트는 40-FB 까지인가 그렇습니다.
그런데 이게 거꾸로 탐색하면 트레일 바이트부터 탐색하기 때문에 어디서 어디까지가 글자 1자인지 모르게 됩니다.

예를 들어볼까요.
82 DD  82 60 2E 라는 코드로 만들어진 문자열이 있다고 합시다.

이걸 앞부터 읽으면 다음과 같이 읽힙니다.
[82DD] [8260] [2E]

이걸 뒤부터 읽으면 다음과 같이 읽힙니다.
[??82] [DD82] [60] [2E]

결국.. 글자가 완전히 깨져버리게 됩니다.

만약 8260 이라는 글자를 찾으려 해도.. 당연히 못찾게 되겠지요.

꼭 뒤에서 앞으로 처리를 하고 싶으시다면.. 먼저 MBCS 코드를 글자별로 나눠놓아야 할 필요가 있습니다.
그러니까..
82 DD  82 60 2E 라는 1바이트 코드를 -> [82DD] [8260] [002E] 라는 2바이트 코드로 일단 나눠놓고 ->
뒤에서부터 [8260]이라는 글자를 찾아야 제대로 찾아집니다.

그리고.. ((BYTE)Source[head]>0x80) 이라는 방법을 너무 신뢰하지는 마세요.
Shift-JIS 코드의 리드바이트는 81-9F, E0-EE 라고 했죠? A0-DF 까지는 1바이트 코드 (반각 가타카나) 입니다.
만약 전국란스 같은데에서 반각 카나가 *홀수* 개 쓰이고 다시 전각으로 들어가는 경우.. 앞에서 읽는다 하더라도 저 방법은 역시 글자가 밀려들어가게 됩니다.

이 게시물을

분류 :: Talk

조회 수 :: 8714
등록일 :: 2008.08.12; 21:20:32

엮인글 :: https://arallab.hided.net/3656/116/trackback

게시글 주소 :: https://arallab.hided.net/board_devtalk/3656

2008.08.12

22:41:51

꺄악[.....]

List of Articles

번호	제목	글쓴이	날짜	조회 수
공지	Talk [필독] 테스트필터 사용시 주의사항	라파에	2008-08-03	179368
109	Archive [플러그인, 소스] FixControlCharactor 20080817_2(테스트버전)	Hide_D	2008-08-17	9965
108	Archive [플러그인, 소스] FixControlCharactor 20080817(테스트버전)	Hide_D	2008-08-17	8975
107	Talk 빈공간[...]	Hide_D	2008-08-16	12464
106	Archive [플러그인, 소스] FixControlCharactor 20080816_2(테스트버전)	Hide_D	2008-08-16	9717
105	Archive [플러그인, 소스] FixControlCharactor 20080816(테스트버전) [1]	Hide_D	2008-08-16	9064
104	Archive [플러그인, 소스] FixControlCharactor 20080815(테스트버전) [2]	Hide_D	2008-08-15	10078
103	Archive [플러그인,소스] 사용자사전 0.3 20080813 (RC)	Hide_D	2008-08-13	8860
102	Talk 플러그인을 만들다가 '또다시' 엄청난 실수를 저질렀다는걸 깨달았습니다. [2]	Hide_D	2008-08-12	8798
»	Talk Hide_D군님, CCustomDic2 의 문제점을 알 것 같습니다.. [1]	whoami	2008-08-12	8714
100	Talk 옵션 스트링 버퍼 말이죠? [1]	Hide_D	2008-08-11	11797
99	Archive [플러그인, 소스] DenyWord 테스트 버전 20080811_2	whoami	2008-08-11	9387
98	Archive [플러그인, 소스] DenyWord 테스트 버전 20080811	whoami	2008-08-11	10639
97	Talk 어휴.. [2]	whoami	2008-08-11	9503
96	Talk 필터 3개 커밋 완료했습니다. [2]	Hide_D	2008-08-11	10170
95	Archive [플러그인, 소스] DenyWord 테스트 버전 20080810_2 [1]	whoami	2008-08-10	9609
94	Talk CustomSD 원문 단어 흘리기 결과. [2]	whoami	2008-08-10	10818
93	Archive [플러그인, 소스] CustomSD 0.3 20080810_2 [1]	Hide_D	2008-08-10	8964
92	Talk whoami님 Util.h의 옵션 파서가 [4]	Hide_D	2008-08-10	8866
91	Talk 다음 계획 [1]	Hide_D	2008-08-10	10875
90	Archive [플러그인, 소스] CustomSD 0.3 20080810(테스트버전) [2]	Hide_D	2008-08-10	8620

쓰기

첫 페이지 12 13 14 15 16 17 18 19 20 21 끝 페이지

Hide_D군님, CCustomDic2 의 문제점을 알 것 같습니다..

Hide_D

검색

로그인