[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-users:55353] Re: Beautifulsoup のバグ
>> squeeze の python-beautifulsoup パッケージの Beautifulsoup の動作にはバグのような症状があります。
> (略)
>> 本家へのバグ報告は、私には難しいので、 報告だけさせていただきます。
>
> えーっと…。
>
> ・どのような動作を想定して実際にはどう動いたのか
> ・どのように操作すると再現するのか
>
> ぐらいは書かないと、何も続かないと思いますが。
失礼しました。
バグを直すというより、パッケージのバージョンをあげれば
よいだけの話だと判断したので、記述しませんでした。
パッケージ作成後、一度でもテストしていれば問題にならないと思いますが・・・・
def setPriceDatas(data, url):
page = urllib2.urlopen(url)
soup = BeautifulSoup(page)
date_strs = soup.findAll(['span'], attrs={"class" : "date"})
※url は 文字列データのURL表記です。
この時点(インスタンス作成直後) で エラーが上がります。
つまり、バグというか、最初から動作しないというか そういう感じです。
本家には、
For almost everyone, the the 3.2 series is the best choice. The most
recent release in this series is 3.2.0, released November 21, 2010.
とありまして、昨年末リリースされた3.2 の利用を推奨しています。
debian の backport には
squeeze-backports (python): error-tolerant HTML parser for Python
3.2.0-2~bpo60+1 [backports]: all
というのがあって、これを期待して aptitude したのですが、何故か
squeeze (stable) (web): error-tolerant HTML parser for Python
3.1.0.1-2: all
の、ダメだったバージョンが入ってきます。
それで、本家リリースの、3.2 を使っています。
報告の目的は、beautifulsoup 自体のバグというより、
3.2.0-2~bpo60+1 [backports]: all
が入ることを期待して、3.1.0.1-2: all が入ってきたことの報告です。
3.2.0-2~bpo60+1xxxx.deb をダウンロードして使えば良いだけの話なのでしょうが、
対象がパーサーなので、頻繁に更新される
setup.py install で ちゃんと動作できた
事から、debian パッケージを使うのを諦めて、本家からのダウンロードで利用する事にしました。