Вопросы по теме 'hive'
Какой фактор определяет, сколько заданий по уменьшению карты используется для запроса?
У меня 2,5 миллиона строк данных и 6 столбцов. При выполнении запроса через улей я иногда получаю 1 задание, иногда 2 задания. Однако мне это кажется совершенно случайным. Какова мера для улья, сколько заданий по уменьшению карты он выполняет для...
840 просмотров
schedule
23.03.2024
Функция Hive histogram_numeric выводит недопустимый символ
Я использую функцию histogram_numeric улья и хочу вывести свой запрос выбора в файл. Однако я получаю неверный символ в файле и не могу использовать его для построения данных.
вот мой код:
INSERT OVERWRITE LOCAL DIRECTORY...
1798 просмотров
schedule
09.04.2024
Увеличьте количество карт Hive в Hadoop 2
Я создал таблицу HBase из Hive и пытаюсь выполнить простую агрегацию. Это мой запрос Hive:
from my_hbase_table
select col1, count(1)
group by col1;
На карте уменьшения задания появляются только 2 картографа, и я бы хотел увеличить это...
39917 просмотров
schedule
22.05.2024
Подзапрос и конкатенация в улье
Я пытаюсь объединить строку и вывод подзапроса в улье. при использовании канала для конкатенации возникает ошибка. Мой вопрос таков.
select id, ('hello:' || (select distinct(name) from abc c1 where c1.id=c2.id and balanc=(select max(balanc) from...
477 просмотров
schedule
22.03.2024
hive - используйте внешний или локальный s3 вместо aws s3
У меня локально работает s3 вместо aws s3. Есть ли способ перезаписать s3.amazonaws.com ? Я создал hive-site.xml и поместил его в ${HIVE_HOME}/conf/ . Вот что у меня есть в .xml:
<configuration>
<property>...
1221 просмотров
schedule
12.06.2024
Запрос на получение даты каждого воскресенья и субботы в Hive или Pyspark
Я хочу получать даты всех воскресений и суббот в Hive с заданной даты. Например, если задана дата 2020-10-01, она должна вернуть две строки sunday_dates, saturday_dates со значениями всех воскресений и суббот после этой даты 2020-10-01.
Я пробовал...
60 просмотров
schedule
19.05.2024