Вопросы по теме 'dataframe'

Как разделить при ранжировании в определенном столбце?
Все: У меня есть кадр данных, подобный следующему. Я знаю, что могу сделать глобальный порядок ранжирования следующим образом: dt <- data.frame( ID = c('A1','A2','A4','A2','A1','A4','A3','A2','A1','A3'), Value =...
17004 просмотров
schedule 29.05.2024

Как создать попарно data.frame
У меня есть data.frame с образцами данных из нескольких sites и years . Я хотел бы создать новый «попарный» data.frame , который создает три столбца, Site_Year , Value_2008 , Value_Year , где Value_Year - значение для любого другого года в...
222 просмотров
schedule 22.05.2024

получить сумму последовательных дневных значений
У меня есть большой набор данных следующим образом: Date rain code 2009-04-01 0.0 0 2009-04-02 0.0 0 2009-04-03 0.0 0 2009-04-04 0.7 1 2009-04-05 54.2 1 2009-04-06 0.0 0 2009-04-07 0.0 0 2009-04-08 0.0 0 2009-04-09 0.0 0...
1794 просмотров
schedule 23.04.2024

Объединить 2 столбца в pandas в один столбец с данными в python
Я не уверен, как это сказать, но я пытаюсь объединить 2 столбца, скажем, из datafram df: x1 x2 NaN 3 2 2 4 2 NaN 5 8 NaN поэтому я хотел бы получить результат X 3 2 4 5 8 Я пытался использовать pd.merge, но это не...
749 просмотров
schedule 22.03.2024

Упорядочить кадр данных по вектору с сохранением индексов
Допустим, у меня есть этот фрейм данных с именем result : id nobs 1 25 463 2 26 586 3 27 338 4 28 475 5 29 711 6 30 932 и этот вектор: ord = c(30, 29, 28, 27, 26, 25) Теперь я понимаю, что я могу упорядочить фрейм данных в...
51 просмотров
schedule 02.06.2024

Ошибка в drop && !has.j: недопустимый тип «x» в «x && y» при использовании суммы (complete.cases) Windows7 R3.2.1
Я очень новичок в программировании, как в R, так и вообще. Вот моя цель для написания этого скрипта: У меня есть 332 CSV-файла. Я хочу: «Напишите функцию, которая считывает каталог, полный файлов, и сообщает о количестве полностью...
14919 просмотров
schedule 14.04.2024

Как удалить строки в кадре данных на основе значений другого кадра данных
Я пытаюсь отфильтровать строки в своем фрейме данных (MainData) на основе критериев p-значений в другом фрейме данных (PvalueData). Итак, я хочу: если более 50% столбцов в строке имеют значение p > 0,05 (PvalueData), то эта конкретная строка будет...
429 просмотров
schedule 18.03.2024

Быстрое извлечение строк data.frame с другим значением в предыдущей строке
Меня интересует извлечение информации из data.frame, в котором значение данной записи во фрейме данных отличается от предыдущего. Вот пример кадра: df <- data.frame(name = rep("a",5), val1 = c(1,1,2,2,2), val2 = c(10,11,12,13,14)) > df...
85 просмотров
schedule 07.05.2024

Как я могу применить groupBy() только для создания групп из более чем X элементов в Pyspark?
Я пытаюсь применить предложение groupBy() к фрейму данных для группировки одинаковых экземпляров, но я хочу, чтобы оно применялось только в том случае, если могут быть созданы группы из более чем 3 элементов. Я имею в виду, что если у меня есть 2...
73 просмотров
schedule 01.05.2024

Слияние Pandas Dataframe в столбце со структурированными данными
Сценарий . В продолжение предыдущего вопроса о том, как прочитать файл Excel из подачи в фрейм данных ( Как читать файл Excel непосредственно с сервера с Python ), я пытаюсь объединить контексты нескольких фреймов данных ( которые содержат данные из...
96 просмотров
schedule 06.06.2024

Общий способ избежать использования специальных символов в R
Ниже приведен ряд тем электронной почты. DF- data.frame. Обратите внимание, что я импортировал это из листа Excel. EmailSubject Buy the stunning new phone The game changer is here. Experience a phone ahead of its time. Thank You Chennai...
141 просмотров
schedule 04.05.2024

как создать фрейм данных с пандами
У меня есть функция под названием getCount(df, score, процент) , она принимает три параметра и возвращает количество человек, основанное на баллах и процентах. Я хочу создать матрицу с процентами в качестве индекса и баллами в виде столбцов....
61 просмотров
schedule 31.03.2024

Результат объекта MonthEnd - ‹11 * MonthEnds› вместо числа
В моем фреймворке pandas я хочу найти разницу между датами в месяцах. Функция .dt.to_period('M') возвращает объект MonthEnd, например <11 * MonthEnds> , вместо номера месяца. Я попытался изменить тип столбца с помощью pd.to_numeric() и...
3624 просмотров
schedule 21.05.2024

Как преобразовать фрейм данных Pyspark в словарь Python
Я новичок в pyspark, у меня есть требование, как показано ниже. Фрейм данных, имеющий два столбца с (id и data_list) с порядком сортировки data_list после группы, как показано ниже. +---+-----+-----+ | id| data|value| +---+-----+-----+...
622 просмотров
schedule 29.04.2024

Возьмите строки с определенным количеством повторяющихся значений
В R у меня есть большой фрейм данных, где первые два столбца - это первичный ID (объект) и вторичный ID (элемент объекта). Я хочу создать подмножество этого фрейма данных с условием, что первичный и вторичный ID должны быть повторены в предыдущем...
77 просмотров
schedule 03.05.2024

Dask выдает ошибку filenotfounderror при чтении csv / отлично работает в Pandas
Я пытаюсь перенести некоторый код Pandas в Dask и столкнулся с проблемой при чтении csv — кажется, что Dask добавляет локальный рабочий каталог к ​​пути к файлу в операции чтения. Он отлично работает, когда я читаю с помощью Pandas. Я использую...
872 просмотров

Решение для повторяющихся значений в заданном диапазоне дат
Error in seq.Date(as.Date(retail$Valid_from), as.Date(retail$Valid_to), : 'from' must be of length 1 Я пробовал оба метода, как указано в вопросе: Как мне поступить с "от" должна быть длиной 1 ошибка? В основном я хочу повторить...
54 просмотров
schedule 23.05.2024

Извлечь элементы из data.frame, используя их координаты
Я пытаюсь расширить ответ из Найти строку в data.frame и Найти несколько строк во всем фрейме данных . Как я могу использовать результаты согласований для извлечения соответствующих элементов data.frame? Здесь под результатами подразумеваются...
47 просмотров
schedule 10.04.2024

найти первое вхождение значения (из списка значений) в кадре данных pandas и вернуть индекс строки
У меня есть фрейм данных pandas: (фактический набор данных намного больше и содержит числа от 1 до 50) date main N1 N2 N3 N4 N5 0 2020-09-18 7-12-14-40-42 7 12 14 40 42 1 2020-09-11 2-5-24-43-45 2 5 24 43...
60 просмотров
schedule 02.05.2024

Фрейм данных подмножества в R, значения строки фильтра dplyr в столбце A, а не NA в строке столбца B
У меня есть набор данных, состоящий из исследования временных рядов. Поскольку некоторые участники не появлялись в течение определенных дней, у них есть значения NA для остальной части массива данных, но определенные учебные дни были решающими,...
45 просмотров
schedule 20.04.2024