반응형

텍스트에서 중복 문자을 제거하는 파이썬 예제코드입니다.

 

2024. 3. 7 최초작성




def remove_duplicate_sentences(text):

    # .을 기준으로 문장을 분리합니다.
    sentences = text.split('.')

    # 고유 문장을 저장할 딕셔너리입니다.  3.7 이상에서는 딕셔너리 순서가 유지됩니다.
    temp_sentences = {}

    for sentence in sentences:
       
        # 문장 앞뒤에 있는 공백을 제거합니다.
        sentence = sentence.strip()

        # 딕셔너리의 키에 이미 없는 경우에만 문장을 딕셔너리에 키로 집어넣습니다.
        if not sentence in temp_sentences.keys():
            temp_sentences[sentence] = True

    # 리스트로 변환한 후, 하나의 문자열로 연결하여 반환합니다.
    unique_sentences = temp_sentences.keys()
    return '. '.join(unique_sentences)


# 입력으로 사용할 텍스트를 사용하여 테스트해봅니다.
text = "이것은 예시 문장입니다. 또 다른 예시 문장입니다. 이것은 예시 문장입니다. 마지막 예시 문장입니다."

result = remove_duplicate_sentences(text)
print(result)




실행결과입니다. 중복 문장이었던 “이것은 예시 문장입니다.”가 하나 제거되었습니다.

 

이것은 예시 문장입니다. 또 다른 예시 문장입니다. 마지막 예시 문장입니다. 

 

반응형

'Python > Python 예제 코드' 카테고리의 다른 글

Python List와 문자열간 변환  (0) 2024.04.10
파이썬 기초 강좌  (5) 2024.03.16
Python Subprocess 모듈 사용법  (0) 2024.03.04
파이썬 두 변수 값 바꾸기  (0) 2024.01.27
Python fire 모듈 간단한 사용방법  (0) 2024.01.14

문제 발생시 지나치지 마시고 댓글 남겨주시면 가능한 빨리 답장드립니다.

도움이 되셨다면 토스아이디로 후원해주세요.
https://toss.me/momo2024


제가 쓴 책도 한번 검토해보세요 ^^

+ Recent posts