SEO 작업을 하다보면 canonical tag 라는 것이 나오는데, 뭔지 잘 모르지만, unique한 URL을 지정해주는 tag인듯하다. 곰곰히 생각해보니, 내 블로그에 있는 글을 지운 것도 많으니, 살아있는 글의 주소값이 뭔지 갑작스럽게 궁금하긴 했다.
아래는 예전에 작성해뒀던, 블로그 제목을 가져오는 코드이다.
코드 내용은 간단한데, 내 블로그의 경우, 주소를 integer값으로 처리하도록 해뒀으니, 1부터 하나씩 검사해서, 살아있으면, 값을 반환하는 형태이다. 지난번 코드를 재사용했으므로, 코드가 거의 비슷한데, range(0, 828)은 내 포스팅의 마지막 숫자라고 보면 되겠다.
작성된 코드는 아래와 같다.
import requests
range = range(0, 828)
f = open("c:\\Users\\[pcname]\\Desktop\\code\\py_pjt\\bbk\\bbk\\url.txt", 'w')
for i in range:
# HTTP GET Request
response = requests.get(url)
status_code = response.status_code
if status_code < 300 and status_code >= 200 :
f.write(url + '\n')
print(url + ' Passed')
f.close()
print('Completed')
이 결과를 잘 사용하면, cononical tag를 작성하는데 도움이 될 법한데... 방법은 좀 생각을 해봐야할 것 같다.
끝.