magazine off

pythonで配列の操作

投稿日 : 2018年5月4日(金曜日)

完全に自分用のメモ。やりたいこと。まず、XMLファイルを取得する。そのxmlファイルの中身から英語の文章が入ったタグのみを全部抽出して配列に入れる。配列の中の一個一個には、短い単位の英語の文章が入っている。そして最後に、英語の文章が入った配列から、一個一個の英単語のみの配列に変形させる。

# -*- coding: utf-8 -*-
import xml.etree.ElementTree as ET
import re
from collections import Counter

# 
# 
# 
# 
# 一個一個の文字列の配列に、変換する
# 
# 
# 
# 
EnglishList = []
tree = ET.parse('/Users/name/Desktop/TMXs/a.tmx')
root = tree.getroot()

tuv = root.findall('.//seg')
for e in tuv:
	#英語だけ取得
    if type(e.text) == str:
    	#print (e.text)
    	EnglishList.append(e.text)
# 
# 
# 
# 
# 一個一個の文字列の配列に、変換する
# 
# 
# 
# 
myList=[]

for item in EnglishList:
    #print(item)
    words = re.split(r'\s|\,|\.|\(|\)', item.lower())
    counter = Counter(words)
    for word, count in counter.most_common():
	    if len(word) > 2:
	       myList.append(    "%s" % (word)    )

print(    "単語配列" )
print(    myList    )

Categories

Recent Posts

【初心者向け】Udemyで学べるAWSおすすめコース3選【現役エンジニアがおすすめ】

  こんにちわ!   エンジニアとして日々活動しておりますりょすけ…

投稿日 : 2021年2月25日(木曜日)

Execute after 3 seconds with jQuery

  Execute after 3 seconds with jQuery s…

投稿日 : 2018年4月13日(金曜日)

【営業しちゃダメなのは何故?】勝手に売れる仕組みを作るたった一つの方法

 https://youtu.be/gA9DyFme1NY (よければ動画見てね…

投稿日 : 2020年12月2日(水曜日)

【初心者向け】Reactとは?開発者は誰?世界中で人気の理由とは?勉強法やキャリアパスを徹底解説!

    こんにちわ!   フロントエンドエンジニアとし…

投稿日 : 2021年2月26日(金曜日)