当用python读取几十万行文本时，会出现什么状况？

前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
作者：accumulate_zhang

我在使用python 读取几十万行的文件中的数据，并构造字典，列表等数据结构时，再访问字典，列表时，一般都会出现内存不够的问题，然后只能循环读取几百行或者一定数量的行数来循环操作。

keyword_list=[line.strip() for line in open("keywords.txt",'r')]
#f1=open("part_wiki_vec.txt",'r')
f1=open("wiki_vectors.txt")
f2=open("result.txt",'w')
i=0
content=f1.readlines()
while i<1150:
for line in content[300*i:300*(i+1)]:
line=line.strip().split(' ')
if line[0] in keyword_list:
wordvec=' '.join(line)
print wordvec
f2.write(wordvec)
#print line
i+=1

我是这样读取的？

应该还有很多好的方法，比如多线程等等。如果你还不是很明白或者正在学习，可以去小编的python交流.裙：一久武其而而流一思（数字的谐音）转换下可以找到了，里面有最新python教程项目，一起交流进步！

做此记录只为了学习，o(∩_∩)o谢谢，不喜勿喷！

《当用python读取几十万行文本时，会出现什么状况？.doc》

下载本文的Word格式文档，以方便收藏与打印。

相关推荐

Python反向输出字符串怎么实现

在 Python 中，你可以通过多种方式来实现字符串的反向输出。这里介绍几个常用的方法：方法1：使用字符串切片 Python 支持字符串（以及其他序列类型）的切片操作，其中包括一个非常方便的步长参数，可以用来实现...
2024-05-26编程代码python
python中bool的应用场景有哪些

条件判断：在条件语句中使用bool类型来判断条件是否成立，例如if语句、while循环等。函数返回值：函数可以返回bool类型的值，表示函数执行的结果是真或假。列表操作：bool类型可以用来判断列表中元素是否...
2024-05-18编程代码python
怎么使用python编写简单鸡兔同笼程序

以下是一个简单的用Python编写的鸡兔同笼程序示例： def calculate_animals(heads, legs): for num_chickens in range(heads+1): num_rabbits = heads - num_chickens if 2*num_chickens + 4...
2024-05-18编程代码python
python任意进制转换的方法是什么

Python中可以使用内置函数bin(), oct(), hex()来进行任意进制之间的转换。具体方法如下：十进制转二进制：bin(number)，将十进制数转换为二进制数。 decimal_num = 10 binary_num = bin(decimal_num) print(bi...
2024-05-18编程代码python
python怎么去掉重复数据

可以通过使用set()来去掉重复数据。以下是一个示例代码： data = [1, 2, 3, 4, 4, 5, 6, 6, 7] unique_data = list(set(data)) print(unique_data) 在这个示例中，将列表data转换为集合set，然后再转换为列表...
2024-05-18编程代码python
python列表重复元素怎么删除

有多种方法可以删除Python列表中的重复元素，以下是其中一种方法： # 创建一个包含重复元素的列表 lst = [1, 2, 3, 1, 2, 3, 4, 5] # 使用set()函数将列表转换为集合，集合不允许有重复元素 unique_lst = list(s...
2024-05-18编程代码python
python中怎么去掉重复项

在Python中，可以使用set()函数来去掉列表中的重复项。例如，假设有一个包含重复元素的列表： my_list = [1, 2, 3, 1, 2, 3, 4, 5] 可以使用set()函数将该列表转换为一个集合，然后再将集合转换回列表： new_li...
2024-05-18编程代码python
python中len函数的使用方法是什么

在Python中，len()函数用于返回指定对象的长度或者元素个数。它可以接受字符串、列表、元组、集合、字典等对象作为参数，并返回它们的长度。例如： # 字符串长度 s = "hello" print(len(s)) # 输出 5 ...
2024-05-15编程代码python