Допустим, я хочу получить случайную выборку клиентов, которые совершили покупку в определенном отделе в прошлом году.
Я хочу убедиться, что случайная выборка из каждого отдела является статистически значимой (используя формулу размера выборки) из общей совокупности клиентов, которые приобрели в отделе (если в отделе было 50 миллионов клиентов, которые сделали минимум 1 покупку , требуемый размер выборки составит около 390).
Я ищу что-то похожее на это: я бы закончил свой SQL-запрос ORDER BY random() LIMIT (подзапрос здесь, чтобы определить правильный размер выборки)
Как реализовать формулу размера выборки в подзапросе, из которого извлекается инструкция LIMIT BY?
random() < XXX
сделать такое, а неORDER BY random() LIMIT ...
.XXX
необходимо заменить наsamplesize(SELECT COUNT(*) FROM T)
. Будет ли это иметь смысл? - person FXD   schedule 20.01.2019