본문 바로가기

쓰기

저번에 (5) 문제.. 기억하시나요?

아마도 이것 때문인 것 같습니다.

void CCustomDic2::PreCustomDic(LPSTR Dest, LPCSTR Source)
{
    // ... 전략 
    for(int head=0;head<SourceLen;head++)
    {
          for(int tail=SourceLen-1;tail>head;tail--)
         {
              // ... 중략 ...

             //2바이트 처리, 수행속도 향상용
             if((BYTE)Source[tail]>0x80){
                   tail--;
             }
         }
         //2바이트 처리, 수행속도 향상용
         if((BYTE)Source[head]>0x80){
              //전각문자라면
              head++;
         }
    }
    Temp+=string(Source,SPoint,SourceLen-SPoint); //마무리
}

저기 빨간 부분..
MBCS 에서는 절대 뒤에서 앞으로 탐색하시면 안됩니다. 특히, 일본어인 경우 더 그렇습니다.

일본어 (Shift-JIS) 의 경우, 리드바이트는 81-9F, E0-EE 까지, 트레일바이트는 40-FB 까지인가 그렇습니다.
그런데 이게 거꾸로 탐색하면 트레일 바이트부터 탐색하기 때문에 어디서 어디까지가 글자 1자인지 모르게 됩니다.

예를 들어볼까요.
82 DD  82 60  2E 라는 코드로 만들어진 문자열이 있다고 합시다.

이걸 앞부터 읽으면 다음과 같이 읽힙니다.
[82DD] [8260] [2E]

이걸 뒤부터 읽으면 다음과 같이 읽힙니다.
[??82] [DD82] [60] [2E]

결국.. 글자가 완전히 깨져버리게 됩니다.

만약 8260  이라는 글자를 찾으려 해도.. 당연히 못찾게 되겠지요.

꼭 뒤에서 앞으로 처리를 하고 싶으시다면.. 먼저 MBCS 코드를 글자별로 나눠놓아야 할 필요가 있습니다.
그러니까..
82 DD  82 60  2E 라는 1바이트 코드를 -> [82DD] [8260] [002E] 라는 2바이트 코드로 일단 나눠놓고 ->
뒤에서부터 [8260]이라는 글자를 찾아야 제대로 찾아집니다.

그리고.. ((BYTE)Source[head]>0x80) 이라는 방법을 너무 신뢰하지는 마세요.
Shift-JIS 코드의 리드바이트는  81-9F, E0-EE 라고 했죠? A0-DF 까지는 1바이트 코드 (반각 가타카나) 입니다.
만약 전국란스 같은데에서 반각 카나가 *홀수* 개 쓰이고 다시 전각으로 들어가는 경우.. 앞에서 읽는다 하더라도 저 방법은 역시 글자가 밀려들어가게 됩니다.

분류 :
Talk
조회 수 :
7811
등록일 :
2008.08.12
21:20:32
엮인글 :
https://arallab.hided.net/3656/39a/trackback
게시글 주소 :
https://arallab.hided.net/board_devtalk/3656

Hide_D

2008.08.12
22:41:51
꺄악[.....]
List of Articles
번호 제목 글쓴이 날짜sort 조회 수
공지 Talk [필독] 테스트필터 사용시 주의사항 라파에 2008-08-03 155440
184 Talk 스마트와 조금 다른 엔진의 처리...(알고보니 유리스엔진) [3] EroGame 2012-05-30 1907
183 Talk XP에서 번역시 단순에 의한 띄어쓰기 처리... [3] EroGame 2012-05-28 1798
182 Talk LEN 기능에서 체크기능 제거 및 투가기능. EroGame 2012-05-10 1766
181 Talk 픽스라인 추가기능 건의. EroGame 2012-04-29 1799
180 Talk 어김없이 기능추가 건의입니다. [3] EroGame 2012-04-22 1865
179 Talk ATCode 새로운 기능 추가. [5] EroGame 2012-04-01 2518
178 Talk SMSTR 의 부가옵션에 대한 토론.. [4] whoami 2012-02-14 3800
177 Talk CustomDic의 동작 방식에 대해서 secret Hide_D 2012-02-14 4
176 Talk AralTrans 20120214 버전 변경점 [6] whoami 2012-02-14 4193
175 Talk XP3Dumper! [1] Hide_D 2011-12-12 5000
174 Talk AralTrans, ATCTNR 111112 버전 SVN에 추가. [1] whoami 2011-11-12 5260
173 Talk FrigateBird님의 ATCode 20111003버전에 대하여.. [9] whoami 2011-11-02 4957
172 Talk Windows 7, UAC, 64bit Hide_D 2011-04-24 9107
171 Talk 컨텍스트 구조 제안(핸들러 구조) [4] Hide_D 2011-04-21 8336
170 Talk AT 0.3 재설계 프로젝트 [1] 아랄 2011-04-16 10551
169 Talk 작전명. '누덕누덕' 작전 시작 Hide_D 2011-02-18 10674
168 Talk AppLoc.exe를 거치지 않고 AppLocale 가동시키는 법! Hide_D 2011-01-28 18684
167 Talk 폰트함수인덧 아무개 2011-01-11 18005
166 Talk 웹 계정 아이디/비밀번호 secret Hide_D 2011-01-02 1
165 Talk DenyWord + 정규표현식? Hide_D 2010-12-18 17305