한국어 형태소 분석기인 Kiwi(Korean Intelligent Word Identifier)의 Python 모듈인 Kiwipiepy 사용방법을 간단히 다룹니다. 2024. 8. 1 최초작성2024. 8. 11 사용자 단어 추가 kiwipiepy를 사용하려면 필요한 패키지를 설치합니다. Python 3.6 이상에서 사용가능합니다. $ pip install kiwipiepy다음처럼 대화형 인터페이스로 형태소 분석기를 테스트해 볼 수 있습니다.한국어 형태소 분석기는 한국어를 형태소로 분리하고 품사를 분석해줍니다. 분리된 형태소는 form 항목에 포함되며 각 형태소의 품사는 tag 항목에 포함됩니다. $ python3 -m kiwipiepykiwipiepy v0.18.0>>> 아버지가방에들어가시다([Tok..
TfidfVectorizer를 사용하여 텍스트를 벡터로 변환한 후(이때 형태소 분석기 Okt를 추가로 사용합니다) , cosine_similarity를 사용하여 벡터간 유사도를 계산합니다. 2023. 11. 08 최초작성 윈도우에 KoNLPy 설치하는 방법은 아래 포스트를 참고하세요. 윈도우에 KoNLPy 설치하는 방법 https://webnautes.tistory.com/1956 추가로 sklearn를 설치합니다. pip install scikit-learn from konlpy.tag import Okt from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.metrics.pairwise import cosine_similar..
윈도우11에 한글 형태소 분석을 위해 사용되는 KoNLPy(“코엔엘파이”)를 설치해서 테스트 해보았습니다. 2020. 1. 11 최초작성 2023. 10. 31 최종작성 OpenJDK 11 사용 0.아직 파이썬 개발 환경을 만들지 않았다면 다음 포스트를 참고하세요. Visual Studio Code와 Miniconda를 사용한 Python 개발 환경 만들기( Windows, Ubuntu) https://webnautes.tistory.com/1842 1. OpenJDK를 설치합니다. 여기에선 11을 설치했습니다. https://www.openlogic.com/openjdk-downloads?field_java_parent_version_target_id=406&field_operating_system_t..