Свързани въпроси 'partition'

MAX Серия от дати преди друга групирана дата
Имам две таблици в система за управление на проекти на сцената, една (опростена) таблица, съдържаща ID на проекта и действителни дати на изход за всеки изход, 1-5. В другата имам исторически запис на всички прогнозни данни; Прогнозирани приходи,...
33 изгледи
schedule 26.09.2022

как работи hashpartitioner в spark?
Да кажем, че имам много данни в няколко s3 файла, около 5 GB всеки, които чета с помощта на sc.textFile Трябва да обединя данните от двата файла, следователно избирам да използвам техниката HashPartitioner и задавам брой дялове 20. Изпратеното...
200 изгледи
schedule 30.09.2022

Проблем със сканиране на пълна таблица в Hive (използвани са разделени колони)
Имам ГОЛЯМА таблица в Hive 0.13 - има приблизително 250 GB данни на ден. Следователно на час това е приблизително 10 GB данни. Имам BI инструмент, който би искал да има достъп до данните на тази таблица на база ден или час, за което трябва да...
1932 изгледи

Вмъкване Презаписване за множество вмъквания в кошер, които имат един и същ дял с една и съща стойност на параметъра
Здравейте, момчета, Така че се опитвам да направя множество вмъквания и успявам да го направя успешно, но ако има две заявки, които имат същия дял и присвоена статична стойност, това ми дава следната грешка :15:02:22 [ОБЯСНЕНИЕ - 0 ред...
1022 изгледи
schedule 23.11.2023

WIndows Azure CentOS разширете OS устройство
В Windows Azure бих искал да разширя моето устройство CentOS OS, за да използва 100 gb вместо 30 gb по подразбиране. Кой е най-лесният начин да направите това? Разгледах много уроци, но всички те се отнасят до windows vm. Някой има ли разходка,...
197 изгледи
schedule 18.05.2024