본문 바로가기
2021-1/Code , Setting ..

Expert | 성능평가 통합

by 이망고_ 2022. 1. 5.

656번 이후로 keyId 확인 후 코드에 입력

파일경로 추가

import os

os.getcwd()

해서 파일이 저장될 경로를 지정해준다

.ipynb vscode에서 주피터노트북 실행시키기 위해 설정

 

pip install jaro.winkler.metric 설치해준다

(anaconda 안됨..)

 

성능평가 실시

1. 완전 같은 매칭

if temp[key]['inst'] == all_inst[-1] : 키기(2개)

# Answer_dict = data0 끄기

(첫번째칸) 두번째줄 켜주고 아래에도 두번째 줄 켜준다
(네번째칸) 두번째 줄 꺼주기

 

2. 전처리 매칭

# if temp[key]['inst'] == all_inst[-1] or (src != "" and src in tgt): 키기(2개)

# Answer_dict = data0 끄기

(*위의 예시가 전처리 매칭, 첫번째 줄 꺼주기, 그 아래로 꺼주기, 4번째 칸 앤설딕도 꺼주기)

 

3. rule 기반 매칭

# if temp[key]['inst'] == all_inst[-1] or (src != "" and src in tgt): 키기(2개)

inst, instbool = check_college(inst)(2개) 끄기

Answer_dict = data0 키기

(첫번째칸) 전처리 매칭 기반으로 그대로, 단, 앤설딕 켜주기
룰 기반 체크칼리지 끄기, 아래 else도 꺼준다
룰 기반들은 앤설딕 켜준다

 

4. 대학테이블을 쓴 rule 기반 매칭

# if temp[key]['inst'] == all_inst[-1] or (src != "" and src in tgt): 키기(2개)

inst, instbool = check_college(inst) (2개)켜기

Answer_dict = data0 키기

(*대학테이블 rule 기반 매칭은 2번전처리 매칭 기반으로 하고, 체크칼리지 2개 모두 켜주고, 앤설딕도 켜준다)

 

PPT 성능평가 결과 만들기

전체저자 = 토탈앤써
통합저자 = 토탈인터그레이션
전체에러 = 토탈에러
통합에러 = 토탈인터그레이션에러

3, 4는 무조건 넣기 빨간 박스는 필요없음

 

예외처리의 경우 상준, 상혁이에게 토스(keyId)

대학테이블로 돌린거는 에러가 생겼을 경우 이상한거를 찾아야됨
print(Answer_dict) 키기

특이케이스는 상준이한테 보내면서 상혁이한테도 보내기(keyid랑 같이)