語彙のカウント(続き)

>>> len(text7)
100676
>>>
>>> len(set(text7))
12408
>>>
>>> len(set([w.lower() for w in text7]))
11387
>>>

さらにアルファベットを含まない単語を取り除く。

>>> len(set([w.lower() for w in text7 if w.isalpha()]))
9109