[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:55353] Re: Beautifulsoup のバグ



>> squeeze の python-beautifulsoup パッケージの Beautifulsoup の動作にはバグのような症状があります。
> (略)
>> 本家へのバグ報告は、私には難しいので、 報告だけさせていただきます。
>
> えーっと…。
>
> ・どのような動作を想定して実際にはどう動いたのか
> ・どのように操作すると再現するのか
>
> ぐらいは書かないと、何も続かないと思いますが。

失礼しました。
バグを直すというより、パッケージのバージョンをあげれば
よいだけの話だと判断したので、記述しませんでした。

パッケージ作成後、一度でもテストしていれば問題にならないと思いますが・・・・

def setPriceDatas(data, url):
  page = urllib2.urlopen(url)
  soup = BeautifulSoup(page)
  date_strs = soup.findAll(['span'], attrs={"class" : "date"})

※url は 文字列データのURL表記です。

この時点(インスタンス作成直後) で エラーが上がります。
つまり、バグというか、最初から動作しないというか そういう感じです。

本家には、

For almost everyone, the the 3.2 series is the best choice. The most
recent release in this series is 3.2.0, released November 21, 2010.

とありまして、昨年末リリースされた3.2 の利用を推奨しています。

debian の backport には
squeeze-backports (python): error-tolerant HTML parser for Python
3.2.0-2~bpo60+1 [backports]: all
というのがあって、これを期待して aptitude したのですが、何故か
squeeze (stable) (web): error-tolerant HTML parser for Python
3.1.0.1-2: all
の、ダメだったバージョンが入ってきます。

それで、本家リリースの、3.2 を使っています。

報告の目的は、beautifulsoup 自体のバグというより、
3.2.0-2~bpo60+1 [backports]: all
が入ることを期待して、3.1.0.1-2: all  が入ってきたことの報告です。

3.2.0-2~bpo60+1xxxx.deb をダウンロードして使えば良いだけの話なのでしょうが、

対象がパーサーなので、頻繁に更新される
setup.py install で ちゃんと動作できた

事から、debian パッケージを使うのを諦めて、本家からのダウンロードで利用する事にしました。