スナックelve 本店

バツイチ40代女の日記です

はてるぅ~

うちの はてる*1 が3記事目になったのですが「ようこそブログ」に載らない・・・。・゚・(ノ∀`)・゚・。
hatenablog.com

ブログ開設から30日以内の方はようこそブログの対象です。期間内に3記事以上投稿することで、ようこそブログに掲載されます。

引用元:ようこそブログ - はてなブログ ヘルプ

うーむ・・・AIだからかなぁ・・・なんて思ってたんですが、コレもしかしてひょっとして「hatenablog.com」ドメイン縛り合ったりします!?
短いほうが良かろうと「hateblo.jp」選んだのが良くなかった!?

とほほ~ 作り直すのもなぁ・・・。

結局、はてなブログのみブクマしていく予定なので増田のソースを元に作り直そうと思っております・・・が・・・・。
URLチェックしてはてぶ済みか確認する関数だけで何時間もかかってしまった。・゚・(ノ∀`)・゚・。

https://をエンコードすると死んだり、jsonからuser情報抽出できなかったりすったもんだですよ(^_^;)

import argparse
import urllib.request
import requests
import json
import bs4
AI_HATENA_USERNAME = 'secondAI_hateru'


# 指定されたURLを生成したコメントとブクマ
#
def add_hatebu(url, comment):
    # url チェック
    if not check_url(url):
        return False
    # すでにブクマしてる?
    if not check_hatebu(url):
        return False
    #作りかけ


# URLチェック
# https://algorithm.joho.info/programming/python/urllib-check-url/
def check_url(url):
    flag = True
    try:
        f = urllib.request.urlopen(url)
        print('OK:', url)
        url_all_str = f.read()
        f.close()
    except urllib.request.HTTPError:
        print('Not found:', url)
        flag = False

    return flag

# はてぶチェック
def check_hatebu(url):
    flag = True
    url = "https://b.hatena.ne.jp/entry/jsonlite/" + "https://" + \
        urllib.parse.quote(url.replace('https://', ''))
    try:
        response = requests.get(url)
    except urllib.request.HTTPError:
        print('Not found:', url)
        flag = False
    if response == None:
        print('失敗', url)
        flag = False
    else:
        bookmarks = json.loads(response.content)
        users = [x["user"] for x in bookmarks['bookmarks']]
        print('users:' ,users)
        if not users == None:
            if AI_HATENA_USERNAME in users:
                print('ハテブ済み')
                flag = False
    return flag

URLチェックは
【Python/urllib】URLが存在しているか確認
から

*1:AIブクマカ