У меня странная проблема с моим транскодером C / C ++ FFmpeg, который принимает входной MP4 (различные входные кодеки) и производит и выводит MP4 (x264, базовая частота и частота дискретизации AAC LC @ 44100 с libfdk_aac):
Получающееся в результате видео в формате mp4 имеет прекрасные изображения (x264), а звук (AAC LC) также работает нормально, но воспроизводится только до половины видео.
Звук не тормозит, не растягивается и не заикается. Он просто останавливается прямо в середине видео.
Один намек может заключаться в том, что входной файл имеет частоту дискретизации 22050, а 22050/44100 - 0,5, но я действительно не понимаю, почему это заставляет звук просто останавливаться через половину времени. Я ожидал, что такая ошибка приведет к неправильной скорости звука. Все работает нормально, если я не пытаюсь принудительно использовать 44100, а вместо этого просто использую входящий sample_rate.
Еще можно предположить, что подсчет очков не работает. Но звук звучит просто отлично (до полной остановки), и я делаю в точности то же самое для видео части, где он работает безупречно. «Точно», как в том же коде, но переменные «аудио» заменены на «видео» -переменные.
FFmpeg не сообщает об ошибках в течение всего процесса. Я также сбрасываю декодеры / кодеры / interleaved_writing после того, как все чтение пакета из ввода завершено. Это хорошо работает для видео, поэтому я сомневаюсь, что в моем общем подходе много неправильного.
Вот функции моего кода (без обработки ошибок и прочего класса):
Настройка AudioCodecContext
outContext->_audioCodec = avcodec_find_encoder(outContext->_audioTargetCodecID);
outContext->_audioStream =
avformat_new_stream(outContext->_formatContext, outContext->_audioCodec);
outContext->_audioCodecContext = outContext->_audioStream->codec;
outContext->_audioCodecContext->channels = 2;
outContext->_audioCodecContext->channel_layout = av_get_default_channel_layout(2);
outContext->_audioCodecContext->sample_rate = 44100;
outContext->_audioCodecContext->sample_fmt = outContext->_audioCodec->sample_fmts[0];
outContext->_audioCodecContext->bit_rate = 128000;
outContext->_audioCodecContext->strict_std_compliance = FF_COMPLIANCE_EXPERIMENTAL;
outContext->_audioCodecContext->time_base =
(AVRational){1, outContext->_audioCodecContext->sample_rate};
outContext->_audioStream->time_base = (AVRational){1, outContext->_audioCodecContext->sample_rate};
int retVal = avcodec_open2(outContext->_audioCodecContext, outContext->_audioCodec, NULL);
Настройка ресамплера
outContext->_audioResamplerContext =
swr_alloc_set_opts( NULL, outContext->_audioCodecContext->channel_layout,
outContext->_audioCodecContext->sample_fmt,
outContext->_audioCodecContext->sample_rate,
_inputContext._audioCodecContext->channel_layout,
_inputContext._audioCodecContext->sample_fmt,
_inputContext._audioCodecContext->sample_rate,
0, NULL);
int retVal = swr_init(outContext->_audioResamplerContext);
Расшифровка
decodedBytes = avcodec_decode_audio4( _inputContext._audioCodecContext,
_inputContext._audioTempFrame,
&p_gotAudioFrame, &_inputContext._currentPacket);
Преобразование (конечно, только если при декодировании был получен кадр)
int retVal = swr_convert( outContext->_audioResamplerContext,
outContext->_audioConvertedFrame->data,
outContext->_audioConvertedFrame->nb_samples,
(const uint8_t**)_inputContext._audioTempFrame->data,
_inputContext._audioTempFrame->nb_samples);
Кодирование (конечно, только если при декодировании был получен кадр)
outContext->_audioConvertedFrame->pts =
av_frame_get_best_effort_timestamp(_inputContext._audioTempFrame);
// Init the new packet
av_init_packet(&outContext->_audioPacket);
outContext->_audioPacket.data = NULL;
outContext->_audioPacket.size = 0;
// Encode
int retVal = avcodec_encode_audio2( outContext->_audioCodecContext,
&outContext->_audioPacket,
outContext->_audioConvertedFrame,
&p_gotPacket);
// Set pts/dts time stamps for writing interleaved
av_packet_rescale_ts( &outContext->_audioPacket,
outContext->_audioCodecContext->time_base,
outContext->_audioStream->time_base);
outContext->_audioPacket.stream_index = outContext->_audioStream->index;
Запись (конечно, только если при кодировании был получен пакет)
int retVal = av_interleaved_write_frame(outContext->_formatContext, &outContext->_audioPacket);
Я совершенно не понимаю, что могло бы вызвать такое поведение.