Свързани въпроси 'partition'
MAX Серия от дати преди друга групирана дата
Имам две таблици в система за управление на проекти на сцената, една (опростена) таблица, съдържаща ID на проекта и действителни дати на изход за всеки изход, 1-5. В другата имам исторически запис на всички прогнозни данни; Прогнозирани приходи,...
33 изгледи
schedule
26.09.2022
как работи hashpartitioner в spark?
Да кажем, че имам много данни в няколко s3 файла, около 5 GB всеки, които чета с помощта на sc.textFile
Трябва да обединя данните от двата файла, следователно избирам да използвам техниката HashPartitioner и задавам брой дялове 20. Изпратеното...
200 изгледи
schedule
30.09.2022
Проблем със сканиране на пълна таблица в Hive (използвани са разделени колони)
Имам ГОЛЯМА таблица в Hive 0.13 - има приблизително 250 GB данни на ден. Следователно на час това е приблизително 10 GB данни. Имам BI инструмент, който би искал да има достъп до данните на тази таблица на база ден или час, за което трябва да...
1932 изгледи
schedule
03.10.2022
Вмъкване Презаписване за множество вмъквания в кошер, които имат един и същ дял с една и съща стойност на параметъра
Здравейте, момчета,
Така че се опитвам да направя множество вмъквания и успявам да го направя успешно, но ако има две заявки, които имат същия дял и присвоена статична стойност, това ми дава следната грешка :15:02:22 [ОБЯСНЕНИЕ - 0 ред...
1022 изгледи
schedule
23.11.2023
WIndows Azure CentOS разширете OS устройство
В Windows Azure бих искал да разширя моето устройство CentOS OS, за да използва 100 gb вместо 30 gb по подразбиране. Кой е най-лесният начин да направите това? Разгледах много уроци, но всички те се отнасят до windows vm. Някой има ли разходка,...
197 изгледи
schedule
18.05.2024