euc-kr 기반의 스톰보드를 utf-8 로 전환하다.
ModelAid 고민/Another Apps euc-kr, utf-8, 게시판, 기존, 변환, 복구, 성공, 스톰보드, 인코딩 View Comments
일단 이번 작업의 시작은 시간을 거슬러 올라가 서버 환경 업그레이드를 하면서부터 시작됩니다.
euc-kr 인코딩으로 그간 사용하고 있었던 서버 환경을 utf-8 로 업그레이드하면서부터 기존의 데이터베이스에 있던 인코딩된 수많은 레코드들은 모두 꼬이기 시작했고, 그것들을 보여주는 프로그램들의 인코딩도 모두 꼬여버렸기 때문이죠.
아마도 킴스큐 (인지 텍스트큐브 판올림인지) 설치할때부터가 아닌가 하는 기억이지만 어쨌거나 이미 상당히 오래전 얘기인지라 기억도 가물가물하군요.
일단은 기존 DB 를 조각 조각내어 euc-kr 로 열어서 utf-8 로 저장할 수 있는 부분은 그렇게 변환해서 저장하고, 그동안 쌓인 방식이 utf-8 이어서 텍스트 깨짐 현상이 없는 부분은 그런 부분대로 놔두는 이른바 데이터 토막내서 인코딩 맞춰 줄세우기 작업부터 진행했었습니다.
스톰보드는 위에서 말한 euc-kr 방식으로 구축된 데이터이므로 정성스럽게 잘라내어 utf-8 로 나누어 놓고 phpmyadmin 을 이용해 올리기 좋도록 대략 5메가 단위의 파일로 쪼개어 준비해 뒀습니다.
이렇게 준비해 놓은 데이터를 모두 업로드하고 나서 스톰보드를 구동해 보니 여전히 스킨과 함수 (특히나 정규식) 등이 euc-kr 인지라 정상적으로 보이지 않더군요.
해서 모든 파일을 BBEdit 을 이용해 euc-kr 로 열어서 한글 관련 내용이 정상적으로 보이도록 한 후에 utf-8 로 컨버팅해서 저장해 주었습니다.
하지만 여전히도 글자는 군데 군데 깨어져 보이더군요.
소스를 열어서 뒤적거려본 결과 소스 코드 내에 <meta http-equiv="Content-Type" content="text/html; charset=euc-kr"> 부분이 있더군요. 다시 파일을 모두 열어서 <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> 로 수정했더니 모두 정상적으로 보이기 시작하더군요.
어라~ 이렇게 쉽게 인코딩 변환을 할 수 있는 것인가라고 생각하고 있을 무렵 기존 갤러리의 한글 파일 이름으로 업로드한 이미지들이 정상적으로 출력되지 않는 문제점을 발견하게 되었습니다.
하.지.만... 이 부분을 어찌 정리해야 하는 것인지는 대략 5시간동안 소스를 뒤적거렸지만 아직 해법을 찾아내지 못했습니다.
str_replace 를 이용해 게시판 뒤에 붙는 수많은 옵션값들을 정리해서 img src=... 식으로 정리한다는 원리까지는 이해했지만 정작 동일한 코드에서 한글 이름이 들어갈 경우 정상적으로 작동하지 않더군요.
물론 좀 더 노력해서 연구해봐야 하겠지만 현재까지의 느낌으로는 정규식 관련 표현법에서 한글파일 이름이 들어가거나 특수문자가 들어가는 부분에 대해서는 특별히 고려하지 않고 넘어간 것이 아닌가 하는 생각을 하고 있습니다.
이전에 스톰보드에서 가장 편했던 것중의 하나인 [==1==] ... [==9==] 와 같은 방식으로 이미지를 삽입했던 부분도 오늘에서야 정규식을 이용해서 구현했다는 것을 알게 되었습니다. (사실 이전에 스톰보드를 사용할 때 까지만 해도 php 코드만 보면 머리가 아팠었는데 이제는 그저 막코딩이 더 편한 것처럼 느껴지는 상황이다보니 어렵지 않은 부분은 이해가 되는 부분도 있더군요.)
저 편했던 기능조차도 1~9 까지밖에 지원되지 않아서 많은 아쉬움이 있었는데 이전에 알았더라면 01~99 까지 정규식 글자 하나만 추가해줬어도 됐을걸~하는 생각도 뒤늦게 들더군요.
그러면서도 현재 운영하려고 하고 있는 킴스큐에서 한글 파일이름의 첨부에 대해서는 실험조차도 안하고 있었으니 오늘은 그 부분을 실험해 봐야겠습니다.
여.튼... 스톰보드를 utf-8 기반으로 변환하고 기존 데이터베이스의 복구까지도 성공적으로 마쳤다는 기념으로 기록을 해 둡니다.
ps. 아직 한글 파일 이름에 대한 부분은 해결되지 않았습니다. 스톰보드에서의 한글파일이름 첨부파일에 대한 이슈를 알고 계시는 분은 알려주시면 감사하겠습니다.
euc-kr 인코딩으로 그간 사용하고 있었던 서버 환경을 utf-8 로 업그레이드하면서부터 기존의 데이터베이스에 있던 인코딩된 수많은 레코드들은 모두 꼬이기 시작했고, 그것들을 보여주는 프로그램들의 인코딩도 모두 꼬여버렸기 때문이죠.
아마도 킴스큐 (인지 텍스트큐브 판올림인지) 설치할때부터가 아닌가 하는 기억이지만 어쨌거나 이미 상당히 오래전 얘기인지라 기억도 가물가물하군요.
일단은 기존 DB 를 조각 조각내어 euc-kr 로 열어서 utf-8 로 저장할 수 있는 부분은 그렇게 변환해서 저장하고, 그동안 쌓인 방식이 utf-8 이어서 텍스트 깨짐 현상이 없는 부분은 그런 부분대로 놔두는 이른바 데이터 토막내서 인코딩 맞춰 줄세우기 작업부터 진행했었습니다.
스톰보드는 위에서 말한 euc-kr 방식으로 구축된 데이터이므로 정성스럽게 잘라내어 utf-8 로 나누어 놓고 phpmyadmin 을 이용해 올리기 좋도록 대략 5메가 단위의 파일로 쪼개어 준비해 뒀습니다.
이렇게 준비해 놓은 데이터를 모두 업로드하고 나서 스톰보드를 구동해 보니 여전히 스킨과 함수 (특히나 정규식) 등이 euc-kr 인지라 정상적으로 보이지 않더군요.
해서 모든 파일을 BBEdit 을 이용해 euc-kr 로 열어서 한글 관련 내용이 정상적으로 보이도록 한 후에 utf-8 로 컨버팅해서 저장해 주었습니다.
하지만 여전히도 글자는 군데 군데 깨어져 보이더군요.
소스를 열어서 뒤적거려본 결과 소스 코드 내에 <meta http-equiv="Content-Type" content="text/html; charset=euc-kr"> 부분이 있더군요. 다시 파일을 모두 열어서 <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> 로 수정했더니 모두 정상적으로 보이기 시작하더군요.
어라~ 이렇게 쉽게 인코딩 변환을 할 수 있는 것인가라고 생각하고 있을 무렵 기존 갤러리의 한글 파일 이름으로 업로드한 이미지들이 정상적으로 출력되지 않는 문제점을 발견하게 되었습니다.
하.지.만... 이 부분을 어찌 정리해야 하는 것인지는 대략 5시간동안 소스를 뒤적거렸지만 아직 해법을 찾아내지 못했습니다.
str_replace 를 이용해 게시판 뒤에 붙는 수많은 옵션값들을 정리해서 img src=... 식으로 정리한다는 원리까지는 이해했지만 정작 동일한 코드에서 한글 이름이 들어갈 경우 정상적으로 작동하지 않더군요.
물론 좀 더 노력해서 연구해봐야 하겠지만 현재까지의 느낌으로는 정규식 관련 표현법에서 한글파일 이름이 들어가거나 특수문자가 들어가는 부분에 대해서는 특별히 고려하지 않고 넘어간 것이 아닌가 하는 생각을 하고 있습니다.
이전에 스톰보드에서 가장 편했던 것중의 하나인 [==1==] ... [==9==] 와 같은 방식으로 이미지를 삽입했던 부분도 오늘에서야 정규식을 이용해서 구현했다는 것을 알게 되었습니다. (사실 이전에 스톰보드를 사용할 때 까지만 해도 php 코드만 보면 머리가 아팠었는데 이제는 그저 막코딩이 더 편한 것처럼 느껴지는 상황이다보니 어렵지 않은 부분은 이해가 되는 부분도 있더군요.)
저 편했던 기능조차도 1~9 까지밖에 지원되지 않아서 많은 아쉬움이 있었는데 이전에 알았더라면 01~99 까지 정규식 글자 하나만 추가해줬어도 됐을걸~하는 생각도 뒤늦게 들더군요.
그러면서도 현재 운영하려고 하고 있는 킴스큐에서 한글 파일이름의 첨부에 대해서는 실험조차도 안하고 있었으니 오늘은 그 부분을 실험해 봐야겠습니다.
여.튼... 스톰보드를 utf-8 기반으로 변환하고 기존 데이터베이스의 복구까지도 성공적으로 마쳤다는 기념으로 기록을 해 둡니다.
ps. 아직 한글 파일 이름에 대한 부분은 해결되지 않았습니다. 스톰보드에서의 한글파일이름 첨부파일에 대한 이슈를 알고 계시는 분은 알려주시면 감사하겠습니다.




back to top
Recent Comments