語彙のカウント(続き)
>>> len(text7)
100676
>>>
>>> len(set(text7))
12408
>>>
>>> len(set([w.lower() for w in text7]))
11387
>>>
さらにアルファベットを含まない単語を取り除く。
>>> len(set([w.lower() for w in text7 if w.isalpha()]))
9109
Pythonで語彙をカウントする。
>>> len(text7)
100676
>>>
>>> len(set(text7))
12408
>>>
>>> len(set([w.lower() for w in text7]))
11387
>>>
さらにアルファベットを含まない単語を取り除く。
>>> len(set([w.lower() for w in text7 if w.isalpha()]))
9109