Вопросы по теме 'hive'

Какой фактор определяет, сколько заданий по уменьшению карты используется для запроса?
У меня 2,5 миллиона строк данных и 6 столбцов. При выполнении запроса через улей я иногда получаю 1 задание, иногда 2 задания. Однако мне это кажется совершенно случайным. Какова мера для улья, сколько заданий по уменьшению карты он выполняет для...
840 просмотров
schedule 23.03.2024

Функция Hive histogram_numeric выводит недопустимый символ
Я использую функцию histogram_numeric улья и хочу вывести свой запрос выбора в файл. Однако я получаю неверный символ в файле и не могу использовать его для построения данных. вот мой код: INSERT OVERWRITE LOCAL DIRECTORY...
1798 просмотров
schedule 09.04.2024

Увеличьте количество карт Hive в Hadoop 2
Я создал таблицу HBase из Hive и пытаюсь выполнить простую агрегацию. Это мой запрос Hive: from my_hbase_table select col1, count(1) group by col1; На карте уменьшения задания появляются только 2 картографа, и я бы хотел увеличить это...
39917 просмотров
schedule 22.05.2024

Подзапрос и конкатенация в улье
Я пытаюсь объединить строку и вывод подзапроса в улье. при использовании канала для конкатенации возникает ошибка. Мой вопрос таков. select id, ('hello:' || (select distinct(name) from abc c1 where c1.id=c2.id and balanc=(select max(balanc) from...
477 просмотров
schedule 22.03.2024

hive - используйте внешний или локальный s3 вместо aws s3
У меня локально работает s3 вместо aws s3. Есть ли способ перезаписать s3.amazonaws.com ? Я создал hive-site.xml и поместил его в ${HIVE_HOME}/conf/ . Вот что у меня есть в .xml: <configuration> <property>...
1221 просмотров
schedule 12.06.2024

Запрос на получение даты каждого воскресенья и субботы в Hive или Pyspark
Я хочу получать даты всех воскресений и суббот в Hive с заданной даты. Например, если задана дата 2020-10-01, она должна вернуть две строки sunday_dates, saturday_dates со значениями всех воскресений и суббот после этой даты 2020-10-01. Я пробовал...
60 просмотров
schedule 19.05.2024