Введение

Чтение всегда было неотъемлемой частью моей жизни. От погружения в книги по истории и шпионских романов до расширения своих знаний с помощью текстов по статистике и машинному обучению я постоянно стремился расширить свой кругозор и утолить свою жажду знаний. Такие авторы, как Мураками, захватили мое воображение, а книги по лидерству и менеджменту дали бесценную информацию о личном и профессиональном росте.

В моей жизни были поворотные моменты, которые сформировали мои взгляды и интересы. Анализируя тенденции в книгах, которые меня привлекали, я надеюсь выяснить, как эти поворотные моменты повлияли на мой литературный путь. Используя Python, я создал скрипт для применения тематического моделирования к заметкам, которые я импортировал из neoReader и Readwise, с целью определения тем, затронутых в книгах, которые я прочитал за последние два года. В этом блоге я представлю процесс и результаты этого исследования, проливая свет на темы и жанры, которые сформировали мою историю чтения.

Сила цифровых книг

Я часто ловлю себя на воспоминаниях о том, как я бродил по книжным магазинам, брал книги и чувствовал волшебство перелистывания страниц в своих руках. Физические книги обладают особым очарованием; однако их ограничения стали более очевидными, когда я глубже погрузился в мир цифровых книг.

Одним из недостатков физических книг является сложность ведения и систематизации заметок. Цифровые книги, с другой стороны, упрощают этот процесс, облегчая создание совокупности знаний и управление ею. Кроме того, удобство ношения цифровых книг во время путешествий или отдыха на пляже невозможно переоценить.

Тематическое моделирование — путь к раскрытию книжных жанров

Чтобы проанализировать книжные жанры, которые я читал, я обратился к моделированию темы, методу, который идентифицирует шаблоны и структуры в коллекции документов. Применяя этот метод к своим заметкам о чтении, я стремился выявить общие знаменатели среди книг, которые я прочитал, и исследовать влияние ключевых моментов на мои литературные интересы.

Методы тематического моделирования, такие как скрытое распределение Дирихле (LDA) и неотрицательная матричная факторизация (NMF), позволяют обнаруживать скрытые темы в наборе документов. Реализовав эти алгоритмы в своем скрипте Python, я смог создать группы ключевых слов, которые послужили основой для дальнейшего анализа.

nlp = en_core_web_md.load()

# Tags I want to remove from the text
removal = ['ADV', 'PRON', 'CCONJ', 'PUNCT',
           'PART', 'DET', 'ADP', 'SPACE', 'NUM', 'SYM']

tokens = []
for highlight in nlp.pipe(df_highlights['Highlights']):
   proj_tok = [token.lemma_.lower(
   ) for token in highlight if token.pos_ not in removal and not token.is_stop and token.is_alpha and len(token) > 2]
   tokens.append(proj_tok)

tokens_concatenated = list(map(lambda x: ' '.join(x), tokens))
tokens_cleaned = list(map(lambda x: get_cleaned_string(x), tokens_concatenated))

dictionary = Dictionary(tokens)

dictionary.filter_extremes(no_below=5, no_above=0.5, keep_n=1000)

corpus = [dictionary.doc2bow(doc) for doc in tokens]

# Optimal model
topics_count = 15
lda_model = LdaMulticore(corpus=corpus, id2word=dictionary, iterations=100, num_topics=topics_count, workers = 4, passes=100)

# Print topics
lda_model.print_topics(-1)

# Visualize topics
lda_display = pyLDAvis.gensim_models.prepare(lda_model, corpus, dictionary, R=10)
pyLDAvis.display(lda_display)

# Save the report
pyLDAvis.save_html(lda_display, f'data/generated_html/index_{topics_count}.html')

Весь код можно найти здесь

Использование ChatGPT для раскрытия сути тем книг

Определив кластеры ключевых слов, я использовал ChatGPT, мощную языковую модель ИИ, чтобы преобразовать эти кластеры в значимые темы. Предоставив ChatGPT подсказку, содержащую кластеры ключевых слов, я получил четкие и лаконичные заголовки тем, которые лучше всего отражали суть каждого кластера.

Эти названия тем, сгенерированные искусственным интеллектом, дали ценную информацию о жанрах и предметах, охватываемых прочитанными мной книгами, что дало мне более глубокое понимание моих читательских предпочтений и привычек.

Q «в приведенном ниже списке есть несколько кластеров, определенных списком слов. для каждого списка слов найдите подходящую тему для описания набора слов: [['сон', 'рем', 'час', 'мозг', 'ночь', 'процент', 'потерять', 'утро', 'время', 'глубокий'], ['новый', 'сеть', 'ссылка', 'идея', 'время', 'практика', 'назначить', 'уровень', 'взять', 'группа'], ['знать', 'жизнь', 'вещь', 'любить', 'люди', 'учиться', 'путь', 'изменяться', 'сделка', 'одинокий'], ['время ', 'изменить', 'конец', 'процент', 'среднее', 'строить', 'опыт', 'мир', 'привычка', 'искать'], ['стратегия', 'помощь', 'индивидуальная ', 'жизнь', 'цель', 'слово', 'мир', 'работа', 'реальный', 'пример'], ['добро', 'знание', 'человек', 'стратегия', 'работа ', 'будущее', 'найти', 'новое', 'образец', 'ценность'], ['действие', 'ресурс', 'история', 'политика', 'великий', 'жизнь', 'высокий ', 'добро', 'давать', 'способность'], ['понимать', 'говорить', 'процент', 'мир', 'разум', 'истина', 'идея', 'управление', 'человек ', 'поле'], ['день', 'поворот', 'естественный', 'изменение', 'важный', 'новый', 'книга', 'потенциальный', 'жизнь', 'норма'], [ 'стоимость', 'современный', 'мечта', 'джон', 'правда', 'конец', 'создание', 'сборка', 'продукт', 'борьба'], ['люди', 'внимание', 'второй', 'книга', 'человек', 'читать', 'маленький', 'день', 'состояние', 'значение'], ['вещь', 'человек', 'идти', 'индивидуум', 'группа', 'убить', 'тип', 'личность', 'хорошо', 'время'], ['проблема', 'опыт', 'человек', 'решить', 'учиться', 'модель', 'навык', 'способность', 'думать', 'вода'], ['хорошо', 'работа', 'идея', 'думать', 'чувствовать', 'люди', 'учить', 'жизнь', 'смотреть', 'неудача'], ['думать', 'нужно', 'приходить', 'идея', 'сила', 'знать', 'факт', 'хорошо', 'хит', 'новый'] ]”

Основываясь на предоставленном списке кластеров слов, я предлагаю следующие темы для описания каждого набора слов:

  1. Качество сна и функция мозга
  2. Нетворкинг и совместное обучение
  3. Личный рост и отношения
  4. Время и адаптивность
  5. Постановка целей и личное развитие
  6. Знания, стратегия и инновации
  7. Принятие решений и лидерство
  8. Восприятие и понимание
  9. Изменения и личный потенциал
  10. Творчество и вызовы
  11. Чтение, концентрация и обучение
  12. Групповая динамика и разрешение конфликтов
  13. Решение проблем и развитие навыков
  14. Рабочая этика и личные размышления
  15. Критическое мышление и адаптивность

Обнаружение ожидаемых и неожиданных тем

Некоторые темы, такие как «Качество сна и работа мозга», не стали неожиданностью, учитывая обширные заметки, которые я сделал, читая «Почему мы спим». Это подтвердило эффективность тематического моделирования и анализа на основе ChatGPT. Другие темы, такие как «Нетворкинг и совместное обучение», резонировали с моими личными интересами к знакомству с новыми людьми и поиску возможностей для сотрудничества.

Изучение развивающихся интересов

Анализ также пролил свет на эволюцию моих интересов с течением времени. Поскольку я учился на протяжении всей жизни, мое первоначальное внимание к инженерии и информатике расширилось и теперь включает такие темы, как «Личный рост и отношения». Этот сдвиг подчеркивает мое растущее осознание важности того, чтобы рядом со мной были правильные люди для достижения больших целей.

Раскрытие основных ценностей и убеждений

Наличие таких тем, как «Время и адаптируемость», «Постановка целей и личностное развитие» и «Знание, стратегия и инновации», дало представление об основных ценностях и убеждениях, которые сформировали мой выбор чтения. Я всегда восхищался людьми, которые успешно изобретают себя заново и осознают важность приспособляемости перед лицом меняющихся обстоятельств. Мой интерес к стратегии в сочетании с пониманием того, что цели без стратегии равносильны принятию желаемого за действительное, также проявляется в этих темах.

Размышление о моделях чтения и личностном росте

Разнообразие тем, раскрытых в ходе этого анализа, не только нарисовало яркую картину моего литературного пути, но и предоставило возможность для самоанализа и личностного роста. Понимая темы, которые возбудили мое любопытство, я могу лучше оценить влияние, сформировавшее мою точку зрения, а также определить области, в которых я, возможно, пожелаю расширить свои знания или изучить новые идеи.

Заключение. Прочное влияние чтения на личностный рост

Когда я размышляю об этом исследовании моей истории чтения, а также о закономерностях и темах, возникших в результате анализа, я вспоминаю, как чтение сыграло неотъемлемую роль в формировании моей жизни. Наряду с регулярными тренировками чтение остается одной из моих самых больших страстей. Это подпитывает мое любопытство, расширяет мой кругозор и дает мне знания и идеи для участия в содержательных беседах на самые разные темы.

Оглядываясь назад, я пришел к выводу, что мой личный ежегодный успех тесно связан с количеством прочитанных мною книг. Эта связь подчеркивает глубокое влияние чтения на мой личностный рост, благополучие и достижения. Постоянно знакомясь с новыми идеями, историями и перспективами, я могу постоянно учиться, адаптироваться и процветать в постоянно меняющемся мире.

Я сделал своим приоритетом чтение каждый день, так как я понимаю, что без этой ежедневной пищи для моего ума я испытываю чувство голода, тоску по озарениям и вдохновению, которые могут дать только книги. Путешествие по моему литературному ландшафту, основанное на тематическом моделировании и ChatGPT, подтвердило важность чтения в моей жизни и вдохновило меня на дальнейший поиск разнообразной и наводящей на размышления литературы.

Чтобы связаться с другими читателями и разделить мою страсть к книгам, я приглашаю вас подписаться на мой список чтения на Goodreads. Эта платформа предоставляет нам возможность обмениваться рекомендациями по книгам, обсуждать наши любимые книги и предлагать названия, которые нам показались интересными и полезными.

В конце концов, это исследование не только дало захватывающий взгляд на темы и жанры, которые сформировали мой читательский путь, но также послужило мощным напоминанием о преобразующей силе книг. Постоянно подпитывая свой разум и бросая вызов своим перспективам, я лучше подготовлен к тому, чтобы справляться со сложностями жизни и добиваться большего успеха как в личном, так и в профессиональном плане. Я с нетерпением жду возможности связаться с вами на Goodreads и вместе отправиться в новые литературные приключения.