본문 바로가기

쓰기

몇가지 필요성 (EncodeKor -_-)에 의해 만들어진 프로그램입니다.

(CP949[ANSI], UTF-8, UTF-16LE, UTF-16BE) 텍스트 파일을 이 프로그램으로 '던져 넣으면'

각 글자마다 몇번씩 사용되었는지 출력해줍니다.



Hide_D

2010.05.29
03:08:27
이건 덤으로 이번 아랄 DB를 마루타 삼아서 긁어봤습니다.

대상으론 적절하겠네요.
첨부 :
db_100529.sql.result.txt [File Size:116.2KB/Download88]

Hide_D

2010.05.29
03:20:53
이건 위 텍스트 파일을 xls로 정리한것

즉, 폴라리스 커뮤니티에서 가장 많이 쓰이는 글자 목록 되겠습니다
첨부 :
db_100529_result.xls [File Size:299.0KB/Download62]

Hide_D

2010.05.29
03:32:11
다음은 기본 완성형 KS 1001 ( http://ko.wikipedia.org/wiki/KS_X_1001 )문자 목록과
기본 자음, 모음 목록 ( http://ko.wikipedia.org/wiki/%ED%95%9C%EA%B8%80 )
첨부 :
초중종.txt [File Size:272Bytes/Download58]
완성.txt [File Size:13.8KB/Download66]

Hide_D

2010.05.29
03:32:52
다음은 위의 SQL 분석표에 완성형과 기본 초중종성에 200000의 가중치를 더해 정렬한 데이터

이 결과로 따르자면, 한글 완성형 외 글자 중에서도 약 1400글자만 추가 수용 하는것으로
대부분의 문자를 표현할 수 있음을 알 수 있습니다.
첨부 :
output.txt [File Size:185.9KB/Download68]
test.cpp [File Size:821Bytes/Download41]

Hide_D

2010.07.07
17:16:00
CP932(Shift_JIS)와
CP949의

'전체 유효 문자' 목록

txt 파일은 기본 출력 파일에서 문자가 있다고 나오지만 실제로는 공백인 문자를 제외한 버전
첨부 :
KR_JP_Char.txt [File Size:476.1KB/Download210]
KR_JP_Character.cpp [File Size:871Bytes/Download58]

Hide_D

2010.07.07
17:19:04
CP949의 전체 목록

txt 파일은 정리된 것
첨부 :
KR_Map.cpp [File Size:393Bytes/Download64]
CP949.txt [File Size:102.5KB/Download51]

Hide_D

2010.07.07
17:30:37
JLPT 1급, 2급의 한자 목록

1급은 2,230자
2급은   986자

출처 : http://www.jlpt-kanji.com/
첨부 :
JLPT1.txt [File Size:4.4KB/Download57]
JLPT2.txt [File Size:1.9KB/Download48]

Hide_D

2010.07.07
19:21:18
추가로 긁어모은 한글 모음

빢삒똠찦뻒딬뵬봘쩗웪봥

Hide_D

2010.07.08
00:29:36
특수 문자 포함한 CP949 -> 부분 문자

이 문자들이 EncodeKor 변환 테이블에 사용됩니다.
현재 : 4084자

이후에 추가되는 문자는 정렬되지 않고 이 뒤로 이어집니다
첨부 :
KR_Complete.txt [File Size:8.0KB/Download97]

Hide_D

2010.07.08
02:20:12
Shift-JIS의 한자영역해서 JLPT 1급 한자를 제외한 부분

EncodeKor 변환 테이블에 사용됩니다.
첨부 :
JP_Complete.txt [File Size:8.8KB/Download78]

Hide_D

2010.07.08
22:35:03
특수 문자를 1:1 대응해서 다시 제작한
KR_Complete.txt
JP_Complete.txt

KR_Map.txt
JP_Map.txt
첨부 :
JP_Complete.txt [File Size:9.7KB/Download86]
KR_Complete.txt [File Size:8.8KB/Download98]
JP_Map.txt [File Size:228.0KB/Download63]
KR_Map.txt [File Size:228.0KB/Download56]

Hide_D

2010.07.08
23:10:37
현재까지의 자료를 기반으로 완성된 EncodeKor, DecodeKor

Visual C++ 2010으로 제작되었으나 VC 6.0버전도 가능

위의 JP_Complete.txt KR_Complete.txt JP_Map.txt KR_Map.txt과 같은 기초 자료,
EncodeKor.h cpp 파일은 임의 개조 및 사용이 가능합니다.


100709 02:36 문자열 종결자 관련 버그 수정
첨부 :
EncodeKor.zip [File Size:27.9KB/Download87]

Hide_D

2010.07.09
03:04:26
EncodeKor에서 樮(뷁), 또는 浣(쀍)가 보인다면 문제가 있는 경우입니다.

Hide_D

2010.07.21
03:33:08
여기서 EncodeKor를 좀더 확장한다면
일본어 JLPT1급 한자 구역 <-> 한국 일반 한자 구역
의 매핑이 필요할 것 같습니다.

우선 http://ko.wikipedia.org/wiki/%EC%9D%BC%EB%B3%B8%EC%9D%98_%EC%83%81%EC%9A%A9%ED%95%9C%EC%9E%90_%EB%AA%A9%EB%A1%9D  (일본의 사용한자 목록)을 참고하여
변환을 시도할 계획입니다.

Hide_D

2010.10.25
09:55:31
JLPT1급 한자 <-> 한국 일반 한자 변환 결과
http://homepage3.nifty.com/jgrammar/ja/tools/tradkan.htm
이 홈페이지를 이용한 결과입니다.
첨부 :
JPT1_Cvt_Ko.txt [File Size:5.1KB/Download89]
JLPT1_Src.txt [File Size:4.9KB/Download74]
List of Articles
번호 제목 글쓴이 조회 수sort 추천 수 날짜 최근 수정일
공지 Talk [필독] 테스트필터 사용시 주의사항 라파에 155439   2008-08-03 2008-12-16 00:03
129 Archive [플러그인, 소스] 사용자 대본 & 사전 플러그인 20080809(테스트버전) [2] file Hide_D 8362   2008-08-09 2008-08-10 00:02
 
128 Talk 컨텍스트 구조 제안(핸들러 구조) [4] Hide_D 8336   2011-04-21 2011-04-23 20:17
가령 모듈 3가지가 DumpText, FixLine, EzTransXP 요렇게 있다고 가정할때 var c0_EzTransXP = new EzTransXP("NoSpace"); var c0_DumpText = new DumpText("KOut,KHex,KHex16"); var c0_FixLine = new FixLine("/ATData/c0.dat"); c0_DumpText.setNext(c0_EzT...  
127 Talk VS 2005로 갈아탔습니다 [1] Hide_D 8272   2008-08-03 2009-01-06 01:34
MFC, 리소스 에디터 때문에 도저히 못 버티다가 옮겼습니다. VS 2008 깔고는 그 느린 속도에 기겁했는데, 이쪽은 꽤 빠르네요. [우홋홋] 근데, 2005와 2008 차이가 뭐죠? 버전 옮길때 그냥 파일 열고 버전 숫자만 바꾸면 땡이네요[...]  
126 Archive [플러그인, 소스] DenyWord 테스트 버전 20080810 file whoami 8164   2008-08-10 2009-01-06 01:26
 
125 Talk 어? ezTransXP 플러그인을 분석하다 생각난건데 [1] Hide_D 8162   2008-07-22 2008-11-22 16:38
이 플러그인에서는 전각 기호는 다른 코드로 치환해 뒀다가 다시 전각 기호로 되돌려주는데, 반각기호는 처리법이 약~간 특이합니다. 1. 원문에 ()<>{}가 없고, 번역문에 ()<>{}가 있으면, ()<>{}와 그 안의 내용을 날립니다. 2. 원문에 ()<>{}가 있고, 번역문...  
124 Talk 개행 처리 관련해서 일단 제 구상입니다 Hide_D 8149   2008-08-21 2009-01-06 01:05
랄까 어느새인가 개행처리가 아니라 텍스트 처리 필터가 되어있습니다만[......] (CmdFilter는 텍스트와 텍스트 바깥을 구분하고, 이건 텍스트 내부를 처리하는 느낌?) 우선 입력 받을 내용은 MaxLine MaxWord (MaxChar?) 개행 기호 문자열(또는 Hex) 그리고 ...  
123 Archive [플러그인, 소스] FixControlCharactor 20080816(테스트버전) [1] file Hide_D 8131   2008-08-16 2009-01-06 02:05
 
122 Archive [플러그인, 소스] FixControlCharactor 20080817(테스트버전) file Hide_D 8126   2008-08-17 2009-01-06 01:01
 
121 Talk DumpText는 아직 개선이 좀 필요한듯; [3] Hide_D 8111   2008-08-03 2009-01-06 01:00
여러개를 켤 수가 없다는 단점이 있네요[...] 그나저나 질문, 헤더 파일에서 extern으로 선언하면 그 프로그램 전체에서 공유되는건가요? 그렇다면, 창은 하나만 띄우고 플러그인 로드될때마다 번호를 매겨서 옵션을 먹여야 하려나요..  
120 Archive [플러그인, 소스] DenyWord 테스트 버전 20080811 file whoami 8097   2008-08-11 2009-01-06 01:05
 
119 Archive [플러그인, 소스] DenyWord 테스트 버전 20080809 [1] file whoami 8067   2008-08-09 2009-01-06 01:26
 
118 Archive [플러그인, 소스] CustomSD 0.3 20080810_2 [1] file Hide_D 8012   2008-08-10 2009-01-06 01:26
 
117 Talk cmd로 리버ex 테스트 [2] file 앙마vv 8011   2008-07-25 2009-01-06 01:27
 
116 Archive [플러그인,소스] 사용자사전 0.3 20080813 (RC) file Hide_D 7965   2008-08-13 2008-08-14 23:24
 
115 Talk 플러그인을 만들다가 '또다시' 엄청난 실수를 저질렀다는걸 깨달았습니다. [2] Hide_D 7929   2008-08-12 2009-01-06 01:01
이쪽은 프로그래밍이라보가는 구상과 관련된 문제네요 ㅠ_ㅠ 현재 제가 손대고 있는 플러그인이 사용자사전 사용자대본 개행문자처리 컨트롤문자처리 인데, 두개씩 묶여있는 구조죠. 그런데... 사용자대본 -> 문장단위처리 사용자사전 -> 단어단위처리 개행문...  
114 Talk whoami님 Util.h의 옵션 파서가 [4] Hide_D 7908   2008-08-10 2008-08-10 15:13
문자열 을 지원하나요? 아니... 으음 c:documents and settindsuser내 문서Game,A루트(미완성).txt 라는 문자열을 파서로 받을 수 있나요?  
113 Talk 0.3에서 추가할것 Hide_D 7908   2008-08-03 2009-01-06 01:00
까먹을까봐 정리 사용자 사전계 1. 사용자사전 유/무 2. 범용사용자사전 유/무 3. 사용자 정의한 주소의 파일 열기(취소) 4. 탭처리 5. 검색 알고리즘 강화(보류) ezTransXP 강화계 1. 번역후 괄호 처리(다이얼로그에 추가)(보류) 2. 사용자 사전과 완벽히 분...  
112 Archive [플러그인] ATCode - OVERWRITE 테스트 버전 20080721 file whoami 7900   2008-07-21 2009-01-06 01:27
 
111 Talk 리얼라이브 세이브에 대해서... [4] 나는누구인감? 7894   2008-08-01 2009-01-06 01:00
오늘 학교에서 하라는 공부는 안하고 곰곰히 생각을 해봤습니다. 세이브 할 경우 현재 위치의 이미지 정보 읽어들임 → 현재 위치의 대사 정보 읽어들임 → 세이브 파일에 저장 로드 할 경우 세이브 파일의 이미지 정보 읽어들임 → 세이브 파일의 대사 정보 읽어...  
110 Talk DumpText를 만들고 있는데... [2] Hide_D 7892   2008-08-02 2008-08-02 12:04
밖에서 모달리스 다이얼로그 안으로 데이터를 넣어주는 간단한 방법 없나요 =ㅅ=; 저 방법이 생각안나서 지금 해보려고 하는게, 실시간으로 바깥의 isTextFilled 를 체크해서 true인 경우만 밖의 텍스트를 가져온 다음에 isTextFilled를 false로 만드는 방법밖...