在python中使用elasticsearch 需要注意的一些问题

1， py es client 使用是 http ，java api 使用是 tcp

2, es.scroll（）方法在查询多个索引的时候会报：

elasticsearch.exceptions.RequestError: RequestError(400, u‘too_long_frame_exception‘, u‘An HTTP line is larger than 4096 bytes.‘)

因为多个索引的时候， _scroll_id 会很长，超过4096， 4096 是 http请求中默认的最大值，所以在请求的时候，服务端会报错。

向下跟代码，把代码改一下：

原来是

page = es.scroll(scroll_id=sid, scroll=‘2m‘, request_timeout=30)

改为

es.transport.send_get_body_as = ‘POST‘

page = es.scroll(body={‘scroll‘: ‘2m‘, ‘scroll_id‘: sid},                 request_timeout=30)

python 库中代码如下：

原文地址：https://www.cnblogs.com/zbw911/p/11089171.html

时间： 2024-10-30 00:42:04

在python中使用elasticsearch 需要注意的一些问题的相关文章

Python 中更优雅的日志记录方案

---恢复内容开始--- 阅读本文大概需要 5 分钟. 在 Python 中,一般情况下我们可能直接用自带的 logging 模块来记录日志,包括我之前的时候也是一样.在使用时我们需要配置一些 Handler.Formatter 来进行一些处理,比如把日志输出到不同的位置,或者设置一个不同的输出格式,或者设置日志分块和备份.但其实个人感觉 logging 用起来其实并不是那么好用,其实主要还是配置较为繁琐. 常见使用首先看看 logging 常见的解决方案吧,我一般会配置输出到文件.控制台和

走入计算机的第四十天（python中sockserver模块）

一.Python中的sockserver模块 1.该模块与sock模块不同之处是该模块自动帮我们分装好了一些功能,让我们在编程的时候直接调用这些功能就可以了,节省了编程步骤. 2.如图所示注释:上图为服务端设置该模块的操作方法比较死板,我们只要会熟悉的使用他就可以了.

python中if name == 'main':

Using a module's __name__ Example? 8.2.? Using a module's __name__ #!/usr/bin/python # Filename: using_name.py if __name__ == '__main__': print 'This program is being run by itself' else: print 'I am being imported from another module' Output $ pytho

关于Python中的yield

关于Python中的yield http://www.cnblogs.com/tqsummer/archive/2010/12/27/1917927.html http://www.ibm.com/developerworks/cn/opensource/os-cn-python-yield/ 一.迭代器(iterator) 在Python中,for循环可以用于Python中的任何类型,包括列表.元祖等等,实际上,for循环可用于任何“可迭代对象”,这其实就是迭代器迭代器是一个实现了迭代器协议

python中的那些“神器”

"武林至尊,宝刀屠龙,号令天下,莫敢不从,倚天不出,谁与争锋",这是神器.不过今天要说的python中的"神器"就没有这么厉害了,这里要说的"神器"其实就是名称里面带了个"器"的,如下: 列表解析器迭代器生成器装饰器列表解析器现在遇到了这样一个问题需要解决:"有一个数字的列表,要求对该列表中的奇数乘以2,返回处理完成后的列表(不改变原来列表的顺序,仅对列表中的奇数乘以2)",比较传统的方法可能会是

Python中字符串格式化如何实现？

Python开发中字符串格式化有两种方式: 百分号方式.format方式百分号的方式相对来说比较老,而format方式则是比较先进的方式,企图替换古老的方式,目前两者并存. This PEP proposes a new system for built-in string formatting operations, intended as a replacement for the existing '%' string formatting operator. 1.百分号方式 %[(na

python 中*args 和 **kwargs

简单的可以理解为python 中给函数传递的可变参数,args 是列表的形式.kwargs 是 key,value的形式,也就是python 中的字典. *args 必须出现在**kwargs 的前边,否则会抛异常. 1 def test(*args, **kwargs): 2 print args 3 print kwargs 1 if __name__ == '__main__': 2 print '---test 1---' 3 test(1, 2, 3) 4 print '---tes

python中super出现的TypeError: must be type, not classobj 原因及解决

执行一下代码,出现错误,TypeError: must be type, not classobj class A(): def __init__(self): print("Enter A") print("Leave A") class B(A): def __init__(self): print("Enter B") super(B, self).__init__()

python中的切片问题

对于在一个字符串中选取几个字符,不同的语言有不同的解决方案,python 中就有了切片的方法. 在list中,如下: s=list(range(1,101)) 如果想要选取偶数个数字(或者选取偶数),可以用循环的方法:但是方法臃肿,比较"笨" 但是python中给出的切片方法是更加的优雅的,如下: L=list(range(1,101)) print(L[0]) print(L[0:10])#输出结果是[1, 2, 3, 4, 5, 6, 7