1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132
| taskmanager.data.port 默认值:0 用于数据交换操作的TM的外部端口.
taskmanager.data.bind-port 默认值:无 用于数据交换操作的TM的绑定端口.
taskmanager.data.ssl.enabled 默认值:true 为TM数据传输启用SSL支持.仅当内部SSL的全局标志"security.ssl.internal.enabled"启用时设置为true.
taskmanager.network.blocking-shuffle.compression.enabled 默认值:false 指示是否将压缩shuffle数据以阻止shuffle模式.
taskmanager.network.compression.codec 默认值:LZ4 压缩Shuffle数据时要使用的编解码器.
taskmanager.network.detailed-metrics 默认值:false 用于启用/禁用有关入站/出站网络队列长度的更详细度量.
taskmanager.network.numberOfBuffers 默认值:2048 网络堆栈中使用的缓冲区数.
taskmanager.network.memory.fraction 默认值:0.1f JVM内存的一小部分用于网络缓冲区. 被taskmanager.memory.network.fraction替代.
taskmanager.network.memory.min 默认值:64mb 网络缓冲最小内存. 被taskmanager.memory.network.min替代.
taskmanager.network.memory.max 默认值:1gb 网络缓冲最大内存. 被taskmanager.memory.network.max替代.
taskmanager.network.memory.buffers-per-channel 默认值:2 在credit-based的流控制模型中,用于每个传出/传入通道(subpartition/inputchannel)的独占网络缓冲区数. 为获得良好的性能,应至少配置2个. 1个缓冲区用于接收subpartition中的in-fight数据, 1个缓冲区用于并行序列化.
taskmanager.network.memory.floating-buffers-per-gate 默认值:8 为每个输出/输入gate(resultpartition/inputgate)使用的额外网络缓冲区数. 在credit-based的流控制模式中,这表示所有inputchannel之间共享多少floating credit. Floating缓冲区基于backlog(subpartition中的实时输出缓冲区)反馈进行分配,有助于缓解subpartition间数据分布不平衡造成的反压. 如果节点之间的往返时间较长或者群集中的机器数量较多,则应增加此值.
taskmanager.network.sort-shuffle.min-buffers 默认值:64 每个sort-merge blocking结果分区所需的最小网络缓冲区数. 对于大规模批量作业,建议增加此配置值以提高压缩比并减少小的网络数据包. 注意:要增加此配置值,您可能还需要增加总网络内存的大小,以避免"网络缓冲区数量不足"错误.
taskmanager.network.sort-shuffle.min-parallelism 默认值:Integer.MAX_VALUE 并行度阈值,用于在sort-merge blocking shuffle和默认的基于哈希的blocking shuffle之间切换 这意味着对于较小的并行度,将使用基于哈希的blocking shuffle,对于较大的并行度,将使用sort-merge blocking shuffle. 注意:sort merge blocking shuffle使用unmanaged direct内存进行数据写入和读取,因此如果发生直接内存错误,只需增加直接内存的大小.
taskmanager.network.memory.max-buffers-per-channel 默认值:10 可用于每个channel的最大缓冲区数. 如果一个channel超过了最大缓冲区的数目,它将使任务变得不可用,导致背压并阻塞数据处理. 这可能会加快检查点对齐,因为在数据倾斜和配置了大量Float缓冲区的情况下,可以防止缓冲的in-flight数据的过度增长. 这个限制没有严格的保证,可以被flatMap操作符,跨越多个缓冲区的记录或产生大量数据的单个计时器忽略.
taskmanager.network.memory.exclusive-buffers-request-timeout-ms 默认值:30000L 为每个channel请求独占缓冲区的超时. 由于本地缓冲池的最大缓冲区数和所需缓冲区数不同,因此可能存在上游任务已占用所有缓冲区而下游任务正在等待独占缓冲区的死锁情况. 超时使独占缓冲区请求失败,并要求用户增加缓冲区总数,从而打破了这种关系.
taskmanager.network.blocking-shuffle.type 默认值:file blocking shuffle类型,可以是"mmap"或"file". "auto"表示根据系统内存结构自动选择属性类型(mmap为64位,file为32位). 请注意,mmap的内存使用情况不受配置的内存限制的影响,但是一些资源框架(如yarn)会跟踪内存使用情况,一旦内存超过某个阈值,就会终止容器. 另外请注意,此选项是实验性的,将来可能会更改.
taskmanager.network.netty.num-arenas 默认值:-1 Netty arenas的数量.
taskmanager.network.netty.server.numThreads 默认值:-1 Netty服务器的线程数量.
taskmanager.network.netty.client.numThreads 默认值:-1 Netty客户端的线程数量.
taskmanager.network.netty.server.backlog 默认值:0 Netty服务器连接积压.
taskmanager.network.netty.client.connectTimeoutSec 默认值:120 Netty客户端连接超时.
taskmanager.network.retries 默认值:0 网络通信的重试次数. 目前它只用于建立input/output channel连接.
taskmanager.network.netty.sendReceiveBufferSize 默认值:0 Netty发送和接收缓冲区大小. 这默认为系统缓冲区大小(cat /proc/sys/net/ipv4/tcp_[rw]mem),在现代Linux中是4mib.
taskmanager.network.netty.transport 默认值:auto Netty传输类型,可以是"nio"或"epoll". "auto"是指根据平台自动选择属性模式. 请注意,"epoll"模式可以获得更好的性能,更少的GC,并且具有更高级的特性,这些特性仅在现代Linux上可用.
taskmanager.network.request-backoff.initial 默认值:100 输入通道分区请求的最小回退(毫秒).
taskmanager.network.request-backoff.max 默认值:10000 输入通道分区请求的最大回退(毫秒).
|