Я иногда упоминаю в своих письменных работах и ​​выступлениях, что у меня есть опыт работы в области социологии, и до того, как я начал свою карьеру в области науки о данных, я был адъюнкт-профессором социологии в Университете ДеПола. Я любил социологию и люблю до сих пор — она во многом повлияла на то, как я понимаю мир и свое место в нем.

Однако, когда я сменил карьеру и обратился к науке о данных, я потратил много времени, объясняя, как этот фон, обучение и опыт были полезны для моей практики в области науки о данных, потому что это не было очевидно для людей. Я общался со многими инженерами, физиками и другими людьми из STEM, и время от времени у меня определенно выделялся другой подход.

Раньше я объяснял это так: наука о данных актуальна только в том случае, если результаты модели, анализа или инструментов полезны для людей, используются людьми и не причиняют вреда. Из-за этого наука о данных должна быть внимательной к восприятию, реалиям и потребностям людей — это единственный способ, которым мы можем создавать продукты для науки о данных, которые будут полезными и выгодными. Социология изучает то, как люди взаимодействуют с системами, структурами, институтами и культурой. Итак, почти по определению, если мы хотим изучить, как люди взаимодействуют с наукой о данных в любом широком смысле, социология — отличное место для начала.

Наука о данных должна быть внимательной к восприятию, реалиям и потребностям людей — только так мы можем создавать продукты для науки о данных, которые будут полезными и выгодными.

Однако в наши дни меня больше не спрашивают, какое отношение социология имеет к науке о данных. Вместо этого, когда я говорю о том, что я социолог, ставший специалистом по данным, люди хотят говорить о невероятном влиянии, которое ИИ (особенно генеративного типа) оказывает на нашу культуру и институты. Внезапно актуальность понимания того, как работает общество, неразрывно переплетается с практикой науки о данных. На самом деле машинное обучение годами по-разному влияет на всю нашу жизнь, но в последние несколько месяцев оно стало гораздо более очевидным, и темпы изменений ускорились.

Многие люди немного встревожены и в то же время не уверены, что тревога оправдана. Во многом это происходит из-за непостижимости машинного обучения — большинство очень талантливых людей, работающих в этой области и ускоряющих этот темп, не являются учителями, не социологами и не заядлыми коммуникаторами, поэтому вечная проблема научной коммуникации для общественного потребления стала критически важной для науки о данных, как никогда раньше. Похоже, настало время, когда люди, обладающие этим другим набором навыков в этой области, должны принять участие, чтобы помочь.

Развивающийся

Несколько лет назад я выступал с докладом на тему Чему наука о данных может научиться у социологии, который вы все еще можете посмотреть, если хотите. Мои темы в основном были связаны с культурой науки о данных и жизнью практиков — привилегиями, которыми мы пользуемся, будучи учеными по данным, присущей нашей области предвзятостью и так далее. Это кажется немного устаревшим, потому что в то время я думал не столько о социологических приложениях непосредственно к нашей работе, сколько о социологических последствиях того, как мы работаем и кто имеет право стать учеными данных. (Я по-прежнему поддерживаю все свои замечания, но это был относительно узкий объектив.)

Есть расширение этих идей, которые я обсуждал в своем выступлении, но которые кажутся все более и более актуальными в новую эру нашей области. Это то, что область, в которой не хватает разнородности практиков (например, наша), подвергается огромному риску ужасных белых пятен в нашей реальной работе. Не называя какой-либо конкретной категории этой неоднородности (мы знаем, о чем мы здесь говорим, и мы знаем характеристики лидеров ИИ и машинного обучения в нашей культуре), я все еще постоянно сбит с толку тем, что люди не понимают этого. чтобы получить разные идеи, точки зрения, креативность и инновации, вам нужны люди из разных слоев общества. Вы просто делаете. Нет хорошей замены разным опытам жизни в мире, когда речь идет о развитии разных моделей мышления и взглядов на этот мир.

Я до сих пор постоянно сбит с толку тем, что люди не понимают, что для получения разных идей, точек зрения, творчества и инноваций нужны люди из разных слоев общества.

Однако это тема, которая могла бы заполнить целый пост. Я хочу здесь подчеркнуть, что обсуждение этих тем и принуждение нашей области считаться с ними важно и того стоит. Я люблю науку о данных и машинное обучение, и мне невероятно повезло, что я могу делать это как карьеру в течение последнего почти десятилетия. Я думаю, что мы можем делать удивительные вещи, и я рад видеть этот прогресс. Но я также намерен следить за тем, чтобы мы не экономили на показателях качества, которые не так просто измерить количественно, в том числе о нашем влиянии на окружающий мир.

Я имел честь насладиться «Dr. Основной доклад Руммана Чоудхури на SciPy несколько недель назад по вопросам ответственного ИИ, и многое из этого содержания пересекается с тем, как я думаю об этих вопросах. (Она потрясающая, если вы не знакомы.) Она дает четкий и убедительный аргумент в пользу того, что ответственный ИИ должен быть приоритетом для тех из нас, кто работает в этой области, а также для правительства, регулирующих органов и так далее. У нас есть множество умных людей, мчащихся вперед с технологическими достижениями, но не так много людей внутри отрасли, обладающих необходимым технологическим пониманием, которые внимательно изучают последствия этих достижений.

В этом свете кажется важным использовать мои каналы не только для обучения практике науки о данных (что я все еще намерен делать), но и для того, чтобы добавить немного больше социологической точки зрения в разговоры о машинном обучении, искусственном интеллекте, науке о данных и обо всем остальном. иначе мы решаем назвать это следующим. Если в этой сфере есть проблема, которую вы хотели бы проанализировать социологически, пожалуйста, прокомментируйте, и я посмотрю, что я могу сделать.

Больше моих работ можно найти на сайте www.stephaniekirmer.com.

Я использую термины "машинное обучение" и "наука о данных" в некоторой степени взаимозаменяемо. Чтобы уточнить, я считаю машинное обучение частью науки о данных.