Я хотел бы выполнить быстрое сканирование с фильтрацией в оболочке hbase, чтобы получить любые записи, в которых определенное значение столбца равно нулю или пусто. Мне сказали, что я могу сделать это и в PIG, но тоже не знаю, как это сделать. Может кто-нибудь помочь с любым методом, чтобы решить эту проблему. Я сделаю последний вариант в java, но просто подумал, что это будет быстрее?
**TableName, columnFamily, column**
test:table collected:url
Спасибо.
РЕДАКТИРОВАТЬ:
Пробовал следующее:
scan 'test:table',{ COLUMNS => 'collected:url', LIMIT => 10, FILTER => "ValueFilter( =, 'binaryprefix:<>' )"}
Нет результатов, так что, возможно, это работает, но выглядит ли это правильно?
РЕДАКТИРОВАТЬ 2:
Ошибка возвращена:
hbase(main):008:0> scan 'test:table', {FILTER =>
SingleColumnValueFilter.new(Bytes.toBytes('collected'),
Bytes.toBytes('url'), CompareFilter::CompareOp.valueOf('EQUAL'),
Bytes.toBytes(''), true, true), COLUMNS => 'collected:url' }
ArgumentError: wrong number of arguments (6 for 4)