«Главное, что я вынес из хакатона, — никогда не бойся пробовать»: интервью с командой победителей хакатона DANO
Установить винду на новый компьютер уже может каждый второй, а справиться с задачей написания проекта исследования за два дня с использованием большого объема данных — далеко не каждый. Мы поговорили с победителями хакатона DANO, чтобы путем математических вычислений выявить причину успеха.
Глуходед Маша: я из Санкт-Петербурга, учусь в лицее № 533. Мне 16 лет, я закончила 10-й класс. Всю жизнь я увлекалась спортом, но сейчас начала больше уделять время саморазвитию.
Панов Андрей: я из города Кириши, учусь в лицее, 11-й класс. Последние несколько лет я занимался олимпиадной математикой и чуть позже подошел к анализу данных.
Громов Георгий: я из Санкт-Петербурга, учусь в московской школе. Преимущественно занимаюсь информатикой и в последний год увлекся Data Science.
Матвеенко Софья: мне 17 лет, я из Владивостока, но в 10-м классе поступила в АГ СПбГУ и теперь живу в Питере, заканчиваю 11-й класс. Сейчас у меня немало интересов: математика, программирование, экономика, Data Science. В большинстве из них я пока только начинаю развиваться. Еще я люблю фотографию и английский язык.
Смородов Владислав: 18 лет, из Великого Новгорода, по чуть-чуть увлекаюсь математикой, экономикой и программированием, участвую в олимпиадах, играю в ЧГК. До этого занимался компьютерной безопасностью, сейчас двигаюсь в сторону анализа данных.
Почему вы решили участвовать в хакатоне DANO?
Глуходед Маша: я хожу на курсы МЭШ от НИУ ВШЭ. Нам в группу отправили информацию про хакатон DANO и предложили принять участие. На самом деле я всегда за любые мероприятия, поэтому сразу же записалась. Это было очень спонтанно, но позже я начала изучать информацию о хакатоне.
Панов Андрей: у меня есть друг Георгий Громов, он участвовал в олимпиаде DANO и позвал меня вместе с ним принять участие в хакатоне.
Громов Георгий: я еще в декабре участвовал в финале олимпиады, поэтому слежу за социальными сетями DANO.
Матвеенко Софья: я участвовала в олимпиаде DANO, и это был мой лучший олимпиадный опыт за 11-й класс. Мне очень понравились образовательные мероприятия в рамках DANO, сами задания, работа с ментором и командой. Было очень здорово, поэтому захотелось окунуться в эту атмосферу снова.
Смородов Владислав: захотелось применить немногочисленные знания на практике, съездить в культурную столицу, познакомиться с крутыми людьми.
Расскажите о своей команде. Как распределили роли/обязанности, поддерживаете ли вы связь сейчас?
Глуходед Маша: из своей команды я не со всеми была знакома. Я знала только одного человека, который ходил со мной на курсы МЭШ. Он предложил мне присоединиться в его команду, потому что уже есть другие ребята. В итоге мы списались, познакомились и уже на самом хакатоне узнали друг друга побольше.
Панов Андрей: сначала мы собрали троих из пяти участников, это Маша, Георгий и я. Остальных ребят мы нашли в чате, который был создан еще до хакатона. Уже на самом хакатоне решили, что лучше разделить обязанности, но в первый день мы все искали данные, на основе которых планировали строить дальнейшее исследование. Например, Маша занималась дизайном презентации, формулировкой гипотез, чтобы посыл был ясен не только нам, но и всем остальным. Но все равно, если кому-то нужна была помощь, мы вместе думали и решали возникающие вопросы.
Матвеенко Софья: мне кажется, что каждый член нашей команды поучаствовал в разработке гипотезы, ее механизма и прочих «концептуальных» важных частях исследования. Так мы, вместе продумав план исследования, разделились на тех, кто писал код, и тех, кто оформлял результат работы в презентацию. Но, конечно, мы помогали друг другу в непонятных моментах.
Как вы готовились к хакатону, сколько времени потратили на подготовку?
Глуходед Маша: я узнала, что у DANO есть олимпиада по анализу данных, после чего начала смотреть работы прошлого года. На YouTube начала искать информацию по анализу данных и наткнулась на несколько каналов, которые были направлены на эту олимпиаду. Я прошла онлайн-курс по анализу данных, который помог мне подготовиться к хакатону.
Панов Андрей: зимой я прошел курс на платформе Stepic, он был нужен для школы анализа данных от ВШЭ. Также прошел курс по статистике. Перед хакатоном я освежил в памяти все, что знал благодаря курсам. Еще посмотрел серию роликов, которая была подготовлена для олимпиады DANO.
Громов Георгий: конкретно к хакатону я особо не готовился, так как участвовал в олимпиаде DANO. А в рассылке было написано, что, по сути, хакатон — это та же олимпиада, только в сокращенном формате. Сокомандникам, которые не участвовали в олимпиаде, я отправил курсы от DANO на YouTube.
Матвеенко Софья: специально к хакатону я не готовилась, но до этого немного изучала машинное обучение по открытым курсам.
Смородов Владислав: У ШАД Яндекса есть очень хороший учебник именно по анализу данных, также я прошел базовый курс по статистике на stepik, чтобы не путаться в терминах.
Расскажите о проекте, над которым работали два дня.
Глуходед Маша: задание заключалось в том, чтобы выявить факторы, которые влияют на пассажиропоток в метро. С чего начинается исследование? Со сбора данных. У нас были идеи, связанные с криминалистикой, географическим положением города и так далее. Мы почти пять часов искали информацию. Изначально нам было сложно определиться с концепцией, в какую сторону лучше двигаться. Когда мы все-таки определились, началась основная часть нашей работы: построение графиков, постановка исследовательского вопроса, выдвижение гипотезы и презентация.
Панов Андрей: с самого начала нас познакомили с данными, с которыми нам предстояло работать, это данные метро. Информации было много, но нам необходимо было найти еще больше, чтобы получилось исследование. Мы исследовали зависимость развитости наземного транспорта и количества пассажиропотока под землей. Звучит странно, потому что кажется, что чем лучше дороги сверху, тем меньше людей спускаются в метро, но оказалось несколько не так.
На защите проекта мы были четвертыми в очереди, поэтому у нас была возможность послушать выступления других групп и проанализировать их речь. Мы успели сделать хорошую презентацию, распределить роли, чтобы каждый рассказывал часть, в которой он лучше всего разбирается.
Громов Георгий: сразу при открытии хакатона был представлен датасет. Нам рассказали, какие там есть признаки, за какой он год и какие гипотезы можно изначально проверить. Из-за недостатка информации, с которой столкнулись все команды, было трудно за что-то зацепиться.
Матвеенко Софья: в нашем исследовании на хакатоне мы выдвинули гипотезу, что наземный общественный транспорт дополняет метрополитен. Если подробнее — автобусы и прочий транспорт помогают человеку добраться до метро, тем самым увеличивая и в нем пассажиропоток. На самом деле мне кажется, что проводить такие исследования на нескольких городах не вполне корректно, ведь система транспорта уникальна в каждом городе. Где-то наземный транспорт дополняет метро, а где-то и конкурирует с ним. Тем не менее для тех коротких двух дней, которые у нас были, думаю, мы неплохо справились с поставленной задачей.
Как решили поставленную задачу?
Матвеенко Софья: мы нашли дополнительные данные по использованию всех видов общественного транспорта, рассчитали показатели для наземного. После этого оценивали корреляцию между этими показателями и процентом населения, использующим метро, по коэффициенту Пирсона. Также для наглядности мы строили тренд методом наименьших квадратов.
Смородов Владислав: с удовольствием! Посмотрели на зависимости между параметрами, показывающими развитость городского транспорта: количество шеринговых устройств, количество остановок, суммарная длина маршрутов, и увидели слабую, но все-таки положительную зависимость. Порадовались, красиво оформили.
Как проходила коммуникация с ментором? В чем заключалась его помощь?
Глуходед Маша: нашего ментора звали Егор Титов, он со второго курса НИУ ВШЭ. Когда он только к нам пришел, вкратце рассказал о том, что нам нужно делать. Также Егор очень помог структурировать наши мысли. Мы не укладывались по времени, из-за чего очень волновались, а ментор как раз охлаждал наши мысли, чтобы мы могли спокойно работать. А во время перерывов Егор рассказывал нам про свое обучение и о том, как он поступал, что тоже было очень полезно.
Панов Андрей: Егор очень хороший веселый человек, с которым мы могли общаться на «ты». Он всячески помогал нам не сбиться с пути. У нас очень часто менялись гипотезы, и ментор понял, что мы можем бесконечно так разбегаться, поэтому предложил остановиться на чем-то одном. Еще Егор помог разобраться с техническими трудностями, возникшими в первый день. Также Егор рассказывал про свое обучение в университете: что ему было интересно, а что нет, какие трудности и так далее. Спрашивал нас, какую стратегию поступления мы выбрали для себя, потому что из нашей команды три человека поступают в университет уже в этом году.
Громов Георгий: у нас был замечательный ментор, он сыграл ключевую роль в нашей победе. После того как мы начали работать, он дал подсказку, в какую сторону нам развиваться, и мы начали разрабатывать то, что у нас в итоге получилось. Это не то, что нас бы устраивало, но в такие сокращенные сроки важно сделать хоть что-то.
С какими трудностями вы столкнулись за эти два дня? Как вы с ними справились?
Глуходед Маша: было недостаточно информации по некоторым запросам. Мы хотели двигаться в другом направлении, например, как время года влияет на пассажиропоток, но не нашли вообще никакой информации. Перед защитой был небольшой мандраж: мы хотели впечатлить жюри, так как итоговый продукт показался нам очень хорошим, и хотели получить определенный результат.
Матвеенко Софья: самое трудное, на мой взгляд, это поставить хорошую гипотезу, ведь можно исследовать очень много разных интересных взаимосвязей, но при этом хочется и что-то небанальное, и реализуемое, и красивое.
Смородов Владислав: было очень сложно выбрать небанальную идею для исследования. Не хотелось рассказывать о том, что количество людей в метро возрастает при росте цен на бензин. Справились мы с этим благодаря хорошему выбору источников данных и ментору.
Чему вы научились за два дня хакатона?
Глуходед Маша: для меня это был первый опыт участия в подобных мероприятиях. Я научилась коммуницировать с людьми в рамках хакатона, потому что в работе над проектом ты должен не просто дополнять, но еще и приносить какие-то свои мысли. Хакатон дал некую основу, которая поможет мне в участии в следующей олимпиаде.
Панов Андрей: я научился правильно распределять время, чтобы не впадать в прокрастинацию и выполнить задачу за отведенный срок. Научился грамотно работать в команде. В плане анализа я не использовал каких-то вещей, которые не знал до хакатона, но смог повторить то, что знал.
Громов Георгий: в этот раз была более напряженная защита, потому что на олимпиаде DANO у тебя есть примерно месяц на подготовку и ты чувствуешь себя более подготовленным. А на хакатоне даются сутки и ты больше нервничаешь, поэтому навык выступления очень сильно прокачался.
Матвеенко Софья: мне кажется, на хакатоне я научилась чуть лучше работать в команде. Это очень радует, потому что в школе возможностей пробовать себя в этом довольно мало.
Смородов Владислав: научился лучше работать в команде, узнал некоторые технические мелочи анализа данных. Главное, что я вынес из хакатона, — никогда не бойся пробовать.
Что посоветуете будущим участникам?
Глуходед Маша: сконцентрироваться на определенной теме. Понятное дело, что изначально будет много идей, чтобы раскрыть заданную тему, но нужно сфокусироваться на чем-то одном. Еще, конечно, не волноваться и работать в команде. Я видела, как работают другие команды, и очень рада, что у нас коммуникация была спокойной, каждый выполнял свою работу.
Панов Андрей: могу посоветовать подготовиться и хорошо выстроить командную работу. Желательно познакомиться с командой заранее, потому что стоит понимать, кто что умеет и кто что может сделать получше и побыстрее.
Громов Георгий: не искать очень долго чего-то золотого, потому что задача заключается в том, чтобы сделать какое-то минимальное, но цельное исследование. Когда мы подошли к жюри попросить обратную связь, нам сказали, что огромное количество команд шли во все стороны, пытались сделать много, но ничего цельного не получилось.
Матвеенко Софья: будущим участникам я бы посоветовала быть открытыми к обсуждению разных идей со своей командой, не зацикливаться на какой-то одной. А еще точно формулировать свои мысли — на DANO это очень важно.
Смородов Владислав: пробуйте! Если же говорить о конкретных действиях на олимпиаде, то ищите информацию на русском и на английском, хороший исследовательский вопрос — это главное.
Кем видите себя в будущем и куда планируете поступать?
Глуходед Маша: я очень хочу поступить в НИУ ВШЭ на программу «Международный бизнес и экономика». Участие в олимпиаде DANO как раз может помочь мне достичь этой цели.
Панов Андрей: весь прошлый год я писал олимпиады по математике, чтобы по БВИ поступить в питерский филиал Вышки. Буду поступать на программу прикладной информатики и математики. Хакатон дал мне возможность приблизительно посмотреть, что люди делают в анализе данных, не исключено, что в будущем я стану работать в этой сфере.
Громов Георгий: я планирую поступать в ИТМО или в какой-нибудь филиал ВШЭ. Пока что мне очень нравится Data Science и машинное обучение.
Матвеенко Софья: пока я точно не знаю, кем именно стану в будущем: мне нравится изучать много разнообразных вещей. На данный момент больше всего хочу быть аналитиком данных, потому что это, кажется, как раз на стыке разных дисциплин, или заниматься ИИ/машинным обучением. Поступать хочу на ПАДиИИ в питерскую Вышку.
Смородов Владислав: поступать планирую в ВШЭ, либо в Питер на ПАД, либо в Москву на ПМИ. В будущем вижу себя крутым аналитиком и, надеюсь, волонтером на DANO.