요즘 프로젝트를 진행하면서 XML을 파싱할 일이 많습니다. 그때마다 레퍼런스 찾아보기도 그렇고 해서 간략하게 나마 정리해봅니다. 원래 주로 쓰는 언어인 Java로 파싱하려 했으나.. 비록 익숙치는 않으나 아무래도 이런일은 Python 같은 스크립트 언어가 간단하고 편하더군요. 그리고 BeautifulSoup 이란 강력한 XML 라이브러리를 제공하고 있기 때문에 더더욱이나 간단하게 XML을 파싱할 수 있는듯 합니다. BeautifulSoup을 사용하기 위해서는 우선 이 라이브러리를 다운 받아서 설치해야 합니다.

http://www.crummy.com/software/BeautifulSoup/#Download
  다운이 완료된 후 압축을 풀어보면, BeautifulSoup.py, BeautifulSoupTest.py, setup.py 가 있을 것입니다. 해당 PC나 맥의 루트권한 사용자라면 아래 명령어로 설치하시길 권장합니다. 루트권한을 얻지 못한다면 python의 워크스페이스에 BeautifulSoup.py를 위치시키시면 사용 가능합니다.

[root@handkstory ~]#python setup.py install
  이제 BeautifulSoup을 사용하는 방법에 대해 알아보겠습니다.
  아래와 같은 XML이 있다고 가정합니다.(test.xml)

 
  위 XML에서 각 노드의 값과 어트리뷰트의 값을 받아오는 방법은 아래와 같습니다.

#결과
Node : node1
Attr1 : a
Node : node2
Attr1 : b
  만약 XML 파일이 한개가 아니라면 glob과 같이 쓰시면 됩니다. BeautifulSoup과 관련된 더 많은 문서는 http://www.crummy.com/software/BeautifulSoup/ 이곳을 참조하시기 바랍니다.^^
저작자 표시
신고
Posted by 제소

댓글을 달아 주세요



티스토리 툴바