[Prologue]
AI와 대화하다 보면 출력되는 문장에 #, ##, -, * 같은 기호가 섞여 나온다. 이 기호들은 옵시디언과 노션의 단축키에 활용된다.
노션에서 내보내기를 누르면 Markdown & CSV, HTML, PDF 같은 선택지가 보이고,
자동화 툴을 만지다 보면 JSON이라는 말이 등장한다.
블로그 글을 쓰려고 Blogger 편집기를 열면 HTML 보기라는 탭이 있고, RSS 주소를 찾아보면 XML이라는 단어도 따라온다.
처음에는 이런 생각이 든다.
이게 다 개발자들이 쓰는 말 아닌가?
비개발자 시점에서, 딱 마주치는 만큼만 정리해두려 한다.
[파일 형식이라는 약속]
나에게 익숙한 파일형식은 *.hwp, *.pdf, *.jpeg, *.mp4, *.psd, *.ai, *.bak 정도일 듯하다. 물론 오피스 프로그램 확장자 포함.
파일 형식은 "이 내용을 어떤 규칙으로 적어둘 것인가"에 대한 약속이다.
같은 회의 기록이라도 메모장에 적으면 TXT, 노션에서 내보내면 Markdown, 웹에 올리면 HTML, 최종 보고서로 저장하면 PDF가 된다. 내용은 비슷해도 목적이 다르니 담는 그릇도 달라지는 셈이고.
[Markdown] _글을 가볍게 구조화하는 형식
Markdown, 줄여서 MD. 마크다운은 글을 쓰기 위한 아주 가벼운 형식이다. 확장자는 보통 .md를 쓴다.
-----------------------------------------------------------
# 제목
## 작은 제목
- 첫 번째 항목
- 두 번째 항목
-----------------------------------------------------------
복잡한 프로그램 없이 메모장에서도 열리고, 사람 눈으로 봐도 대충 무슨 뜻인지 보인다. 그래서 개발 문서, GitHub의 README, Obsidian 메모, Notion 내보내기, AI 답변 초안에서 자주 등장한다.
마크다운의 장점은 가볍다는 점이다. 글의 뼈대만 잡기 좋다. 제목, 목록, 링크, 강조 정도만 있으면 충분한 초안에는 아주 잘 맞는다.
다만 최종 디자인을 고정하는 형식은 아니다. 어떤 앱에서 여느냐에 따라 표나 줄바꿈이 조금 다르게 보일 수 있다. 그래서 마크다운은 "완성된 인쇄물"이라기보다 "정리 잘 된 원고"에 가깝다.
[HTML] _웹페이지가 알아듣는 형식
HTML은 웹페이지의 기본 형식이다. 확장자는 .html 또는 .htm을 쓴다.
Blogger에 글을 올리면, 우리가 보기에는 문장과 이미지와 링크지만 안쪽에서는 HTML 구조로 저장된다. 제목은 제목이라고 표시하고, 문단은 문단이라고 표시하고, 링크는 링크라고 표시한다.
-----------------------------------------------------------
<h1>파일 형식. 마크다운부터 HTML까지</h1>
<p>파일 형식은 내용을 담는 그릇이다.</p>
<a href="https://rene-log.blogspot.com/">블로그 바로가기</a>
-----------------------------------------------------------
처음 보면 꺾쇠 괄호 때문에 겁이 나지만, 핵심은 단순하다.
HTML은 브라우저에게 "이건 제목이야", "이건 문단이야", "이건 링크야"라고 알려주는 표식이다.
마크다운이 글쓰기용 원고라면, HTML은 웹에 올리기 위한 뼈대에 가깝다. 실제 색상, 글자 크기, 여백 같은 모양은 보통 CSS라는 별도의 규칙이 담당한다.
[JSON] _도구들이 데이터를 주고받는 형식
JSON은 사람이 읽으라고 만든 글이라기보다, 도구들이 서로 데이터를 주고받기 위해 많이 쓰는 형식이다. 확장자는 .json이고, 흔히 '제이슨'이라고 읽는다.
자동화 툴, API, AI 설정, 백업 파일에서 자주 보인다.
-----------------------------------------------------------
{
"title": "회의",
"date": "2026-05-18",
"done": false
}
-----------------------------------------------------------
생긴 건 낯설지만, 구조는 생각보다 직관적이다. title은 회의, date는 날짜, done은 완료 여부. 이렇게 이름과 값을 짝지어 적는다.
JSON은 도구 사이의 택배 송장 같은 것이라고 보면 되려나. 사람이 보기 예쁜 글은 아니지만, 어느 칸에 어떤 정보가 들어 있는지 기계가 정확히 읽기 좋다고 한다.
주의할 점은 쉼표 하나, 따옴표 하나가 틀어지면 파일이 깨질 수 있다는 점이다. 그래서 JSON 파일을 직접 고칠 때는 조심해야 한다. 모르면 열어보기만 하고, 저장은 하지 않는 편이 안전하다.
[CSV] _표를 가장 단순하게 옮기는 형식
CSV는 표 데이터를 주고받을 때 자주 쓰는 형식이다. 확장자는 .csv다.
엑셀, 구글 시트, 노션 데이터베이스, 쇼핑몰 주문 목록, 주소록 내보내기 같은 곳에서 흔히 만난다. 예전 휴대폰 전화번호부 옮기는 작업할 때 많이 본 형식이어서 생각이 난다.
-----------------------------------------------------------
이름,이메일,상태
김아무개,kim@example.com,완료
박아무개,park@example.com,진행중
-----------------------------------------------------------
CSV는 말 그대로 값을 쉼표로 나눠 적는다. 그래서 파일은 아주 가볍고, 대부분의 표 프로그램에서 열 수 있다.
하지만 단순한 만큼 함정도 있다.
전화번호 앞의 0이 사라지거나, 날짜가 마음대로 바뀌거나, 이름 안에 쉼표가 들어가서 칸이 밀리는 일이 생길 수 있다. 한글이 깨져 보이는 경우도 있다.
그래서 CSV는 최종 보고서라기보다 "표 데이터를 옮기는 임시 통로"로 보는 편이 좋다. 예쁘게 보는 건 엑셀이나 구글 시트에서 하고, CSV 자체는 운반 상자에 가깝다.
[XML] _오래된, 그러나 아직 많이 쓰이는 구조화 형식
XML은 HTML처럼 태그를 쓰지만 목적은 조금 다르다. HTML이 웹페이지를 보여주기 위한 형식이라면, XML은 데이터를 구조적으로 담기 위한 형식에 가깝다.
-----------------------------------------------------------
<post>
<title>파일 형식 정리</title>
<date>2026-05-18</date>
</post>
-----------------------------------------------------------
요즘 새로 만드는 서비스에서는 JSON을 더 자주 보지만, XML은 여전히 여러 곳에 남아 있다. RSS 피드, 공공 데이터, 오래된 업무 시스템, 문서 파일의 내부 구조 같은 곳에서 만난다.
블로그의 RSS도 XML 계열이다. 내가 글을 발행하면, RSS 리더나 다른 서비스가 그 XML을 읽고 새 글이 올라왔다는 사실을 알 수 있다.
XML은 조금 장황하다. 같은 정보를 적어도 글자가 많이 든다. 대신 구조가 분명하고, 오래된 시스템과의 호환성이 좋다.
[CHECK] _확장자만 바꾸면 형식도 바뀔까
한 번쯤 이런 생각을 한다.
파일 이름 끝의 .txt를 .json으로 바꾸면, 이게 JSON이 되는 거 아닌가?
아쉽지만 아니다.
확장자는 파일에 붙인 이름표에 가깝다. "나는 JSON이야"라고 적어둔 라벨일 뿐, 안에 든 내용이 JSON 규칙대로 적혀 있어야 진짜 JSON이다. 라벨만 바꾸면 프로그램은 "JSON인 줄 알고 열었는데 내용이 영 아니네" 하고 에러를 뱉는다.
반대도 있다. 분명 .csv인데 엑셀에서 열면 글자가 깨지거나 칸이 밀린다. 이름표는 맞는데 안쪽 약속(쉼표, 따옴표, 인코딩)이 살짝 어긋난 경우다.
그래서 형식을 바꾸고 싶을 땐 확장자 이름을 고치는 게 아니라, 그 프로그램의 '내보내기'나 '다른 이름으로 저장'을 쓰는 편이 안전하다. 이름표를 바꿔 다는 게 아니라 내용을 그 규칙대로 다시 적어주는 일이라고 보면 될 듯.
[한 줄 요약]
복잡하면 딱 한 줄씩만 챙겨도 된다.
- Markdown(.md) — 글의 뼈대를 가볍게 잡는 원고. 메모, README, AI 답변 초안.
- HTML(.html) — 웹페이지가 알아듣는 표식. 블로그에 글을 올리는 순간 만난다.
- JSON(.json) — 도구끼리 데이터를 주고받는 송장. 자동화, API, 설정·백업.
- CSV(.csv) — 표를 가장 단순하게 옮기는 상자. 엑셀·구글시트로 옮길 때.
- XML(.xml) — 오래됐지만 구조는 분명한 데이터 형식. RSS, 공공데이터, 낡은 시스템.
[파일 형식은 언어가 아니라 습관]
처음에는 확장자가 시험 문제처럼 느껴진다.
이건 외워야 하나?
열면 안 되는 건가?
잘못 건드리면 고장 나는 건가?
하지만 파일 형식은 풀어내야 할 문제가 아니라 생활 습관에 가깝다.
부르는 이름은 원고든 송장이든 상자든 제각각이지만, 결국 다 "내용을 담는 그릇"이라는 점은 같다. 이렇게 생각하면 조금은 만만해진다. 물론 그래도 어렵긴 하다.
AI와 자동화 도구가 일상으로 들어올수록 우리는 더 많은 파일 형식을 만나게 될 것이다. 낯선 확장자를 볼 때마다 "이건 어떤 종류의 그릇이지?" 하고 한 번만 물어보면 될 듯.
