안녕하세요. 은공지능 공작소의 파이찬입니다.
오늘은 Permission 에러 없는 Spacy 라이브러리 설치법에 대해 알아보겠습니다.
Spacy는 자연어처리를 위한 라이브러리인데,
Permission 에러 때문에 설치에 애를 먹었던 경험이 있습니다.
그래서 이러한 문제에 대한 해결법을 포스팅으로 작성해보게 되었습니다.

 

 

 

 

 

 

 

 

 

 

 

 

1. Conda를 이용한 Spacy 설치

 

 

conda activate <가상환경이름>
conda install spacy
아나콘다 프롬프트를 실행한 뒤,
conda activate 명령어를 이용하여 원하는 가상환경을 켜줍니다.

그런 다음, conda install spacy 명령어를 입력하여
Spacy 라이브러리를 설치 해줍니다.
설치는 비교적 간단하게 끝납니다. (다음이 중요합니다)

 

 

 

 

 

 

2. 아나콘다 프롬프트 관리자 권한으로 재시작

 

 

 

아나콘다를 종료하시고 오른쪽 마우스를 클릭하여
관리자 권한으로 다시 실행시켜 줍니다.

관리자 권한으로 실행하지 않고 계속 진행한다면,
위의 그림과 같은 에러 화면이 뜨게 됩니다...
(여러분들은 저 같은 실수를 반복하지 마세요... ㅜㅜ)

 

 

 

 

 

conda activate <가상환경이름>
python -m spacy download en
관리자 권한으로 실행시키셨다면, 위의 명령어를 입력하여
Spacy의 en 모델을 다운로드 해줍니다.
(**en은 english의 줄임말입니다.)

 

 

 

 

 

정상적으로 모델을 다운받았다면, 위와 같은 화면이 뜨게 됩니다.

 

 

 

 

 

 

3. 간단한 테스트

 

 

 

Be extremely subtle, even to the point of formlessness. 
Be extremely mysterious, even to the point of soundlessness. 
Thereby you can be the director of the opponent's fate.


미묘하고도 미묘하여 보이지 않는 경지에 이르며, 
신비하고도 신비하여 소리가 없는 경지에 이른다. 
그러므로 능히 적의 생사를 맡아 다스리게 되는 것이다.
- 손자병법 -
제가 좋아하는 손자병법의 구절 중 하나입니다.
지금부터 이를 단어별로 Tokenizing(쪼개기)하는 테스트를 해보겠습니다.

 

 

 

 

 

import spacy

a = spacy.load('en') # 잉글리시 버전의 패키지를 불러온다.
sentence = "Be extremely subtle, even to the point of formlessness. Be extremely mysterious, even to the point of soundlessness. Thereby you can be the director of the opponent's fate."

doc = a(sentence)

word_tokenized_sentence = [token.text for token in doc]

print(word_tokenized_sentence)
output:
['Be', 'extremely', 'subtle', ',', 'even', 'to', 'the', 'point', 'of', 'formlessness', '.', 'Be', 'extremely', 'mysterious', ',', 'even', 'to', 'the', 'point', 'of', 'soundlessness', '.', 'Thereby', 'you', 'can', 'be', 'the', 'director', 'of', 'the', 'opponent', "'s", 'fate', '.']
단어별로 토크나이징(쪼개기)가 잘 된 것을 보실 수 있습니다. #테스트 성공적

네 이렇게 오늘은 Anaconda python에서 spacy 라이브러리 설치와
간단한 토크나이징 테스트까지 해보았습니다.

기회가 된다면 다음에 자연어처리 관련된 포스팅도 작성해보도록 하겠습니다.
지금까지 긴 글 읽어주셔서 감사합니다.

 

블로그 이미지

pychan

딥러닝에 관련된 시행착오, 사소하지만 중요한 것들, 가능한 모든 여정을 담았습니다.

댓글을 달아 주세요