ホーム

pythonで配列の操作

2018年5月4日

0
0

完全に自分用のメモ。やりたいこと。まず、XMLファイルを取得する。そのxmlファイルの中身から英語の文章が入ったタグのみを全部抽出して配列に入れる。配列の中の一個一個には、短い単位の英語の文章が入っている。そして最後に、英語の文章が入った配列から、一個一個の英単語のみの配列に変形させる。

# -*- coding: utf-8 -*-
import xml.etree.ElementTree as ET
import re
from collections import Counter

# 
# 
# 
# 
# 一個一個の文字列の配列に、変換する
# 
# 
# 
# 
EnglishList = []
tree = ET.parse('/Users/name/Desktop/TMXs/a.tmx')
root = tree.getroot()

tuv = root.findall('.//seg')
for e in tuv:
	#英語だけ取得
    if type(e.text) == str:
    	#print (e.text)
    	EnglishList.append(e.text)
# 
# 
# 
# 
# 一個一個の文字列の配列に、変換する
# 
# 
# 
# 
myList=[]

for item in EnglishList:
    #print(item)
    words = re.split(r'\s|\,|\.|\(|\)', item.lower())
    counter = Counter(words)
    for word, count in counter.most_common():
	    if len(word) > 2:
	       myList.append(    "%s" % (word)    )

print(    "単語配列" )
print(    myList    )
Pocket
LinkedIn にシェア

  • この記事を書いた人
  • 最新記事

藤沢瞭介(Ryosuke Hujisawa)

りょすけと申します。18歳からプログラミングをはじめ、今はフロントエンドでReactを書いたり、AIの勉強を頑張っています。off.tokyoでは、ハイテクやガジェット、それからプログラミングに関する情報まで、エンジニアに役立つ情報を日々発信しています!

-ホーム

Copyright© off.tokyo , 2021 All Rights Reserved Powered by AFFINGER5.