Вы решаете задачу предсказания стоимости автомобиля какая модель не может быть использована

Содержание

IFRS 13 — Как определить справедливую стоимость автомобиля по МСФО?
Правила определения справедливой стоимости по МСФО.
Методы оценки по МСФО (IFRS) 13.
Иллюстрация методов оценки МСФО (IFRS) 13.
Построить, разработать и внедрить модель машинного обучения для прогнозирования стоимости автомобилей с использованием градиентного ускорения.
Введение
Постановка цели исследования
Получение данных
Предварительная обработка и очистка данных
Очистка данных
Удалить ненужные столбцы
Исследование и визуализация данных
В: Как цена распределяется по годовой модели по типу топлива?
Моделирование данных
Развертывание модели с Heroku
Вывод
Полезные ссылки
PaacMaan / авто-цена-предсказатель
Предсказатель цены автомобиля — Этот проект шаг за шагом показывает, как построить модель, которая может предсказать цену автомобиля на основе…
github.com

IFRS 13 — Как определить справедливую стоимость автомобиля по МСФО?

Определение справедливой стоимости нефинансового актива, для которого нет рыночных данных, часто представляет собой сложную задачу, требующую множества суждений. Рассмотрим на примере автомобиля, как использовать доходный и затратный подходы для определения справедливой стоимости в соответствии с МСФО (IFRS) 13.

Предположим, что у компании есть на балансе автомобиль, и мы должны определить его справедливую стоимость.

Вы купили машину около 2 лет назад за 50 000 д.е., а затем потратили 10 000 д.е. на тюнинг и модификацию автомобиля.

И вы на самом деле используете эту машину в вашем бизнесе.

Как следует определить его справедливую стоимость в соответствии с правилами МСФО?

Это большой вопрос, поскольку определение справедливой стоимости нефинансовых активов является довольно сложной задачей, и на практике это часто требует множества суждений, поскольку рыночные цены для некоторых активов не всегда известны.

Приведем несколько практических советов.

Правила определения справедливой стоимости по МСФО.

Прежде всего, вы должны изучить стандарт МСФО (IFRS) 13 «Оценка справедливой стоимости», в котором установлены основные принципы того, как определить справедливую стоимость чего-либо.

IFRS 13 также содержит раздел, посвященный нефинансовым активам (см. параграфы IFRS 13:27-33).

Но, что такое справедливая стоимость?

Это цена, которая будет получена от продажи актива или уплачена при передаче обязательства в ходе обычной сделки между участниками рынка на дату оценки (см. определение в IFRS 13:Appendix A).

Для нефинансовых активов, существует специальное правило:

Наилучшее и наиболее эффективное использование актива (англ. ‘highest and best use’) означает, что участники рынка стремятся максимизировать стоимость актива (или группы активов).

Итак, когда вы оцениваете свой собственный нефинансовый актив, вы всегда должны задумываться о наилучшем и наиболее эффективном использовании этого актива:

Можно ли использовать актив альтернативным образом?

Какой была бы справедливая стоимость актива, если бы мы использовали его по-другому?

Для небольшой иллюстрации, предположим, что вы — девелопер и работаете с земельными участками для промышленного использования. Допустим, вы хотите построить склад и завод на данном земельном участке.

Но многие девелоперы уже начали строить жилые здания на прилегающих землях, так что вы должны подумать о потенциальном использовании вашей земли под жилищное строительство.

Допустим, что стоимость земли промышленного назначения составляет 100 000 д.е., но стоимость той же земли под жилой фонд составляет 140 000 д.е.

Кроме того, вам нужно будет заплатить 10 000 д.е., чтобы получить все соответствующие разрешения для перевода земли в фонд жилищного строительства. Поэтому чистая стоимость земли под жилищное строительство составит: 140 000 д.е. — 10 000 д.е. = 130 000 д.е.

И теперь вы приходите к выводу, что наилучшее и наиболее эффективное использование для земли не промышленное, а жилищное, и его справедливая стоимость составляет 130 000 д.е.

Как правило, вы предполагаете, что текущее использование вашего актива является наилучшим и наиболее эффективным, тем не менее, как показывает приведенный выше пример, этим вопросом нужно задаваться постоянно.

Методы оценки по МСФО (IFRS) 13.

Теперь вернемся к нашему автомобилю.

Итак, предположим, что у вас нет никаких рыночных данных о вашей 2-летней нестандартной тюнингованной машине.

В этом случае вам нужно использовать определенный метод оценки.

IFRS 13 допускает 3 метода оценки (см. параграфы IFRS 13:61-62):

Рыночный подход (англ. ‘market approach’) — здесь определить справедливую стоимость вашей машины на основе рыночных сделок с идентичными или аналогичными машинами. К нашему примеру этот подход неприменим, поскольку сделок с идентичной или аналогичной машиной из-за модификации автомобиля.
Доходный подход (англ. ‘income approach’) — вам необходимо оценить будущие денежные потоки от актива и дисконтировать их, чтобы получить общую приведенную стоимость.
Затратный подход (англ. ‘cost approach’) — или восстановительная стоимость подход, согласно которому справедливая стоимость является сумма, необходимая для замены текущего актива.

Какие метод оценки следует использовать?

Правила МСФО не отдают приоритет какому-либо методу, но вы определенно должны максимально использовать наблюдаемые исходные данные (англ. ‘observable inputs’) для этих методов (например, рыночные цены) и свести к минимуму использование ненаблюдаемых данных.

Если у вас нет рыночных цен на активы, то опять же, об использовании наблюдаемых исходных данных не может быть и речи. Тем не менее, вы должны использовать тот метод, который подходит для ваших обстоятельств, а иногда вы можете использовать более одного метода.

Конечно, при использовании более одного метода для оценки стоимости актива, может случиться так, что у вас будет несколько разных значений справедливой стоимости.

В этом случае, вы должны разумно взглянуть на эти значения справедливой стоимости и выберите то, которое является наиболее показательной в ваших обстоятельствах.

Это требует множества суждений, и именно поэтому невозможно дать один общий рецепт для определения справедливой стоимости.

Иллюстрация методов оценки МСФО (IFRS) 13.

Проиллюстрируем все вышесказанное на приведенном примере автомобиля.

Предположим сначала, что в настоящий момент машина используется наилучшим и наиболее эффективным образом, поэтому мы не должны принимать во внимание другие альтернативы.

И давайте предположим, что машина может генерировать денежные потоки как самостоятельный актив, поэтому, мы можем также применить доходный подход и затратный подход.

Поскольку автомобиль был значительно модифицирован, было бы не разумно применять рыночный подход.

Опять же, это вопрос суждений, потому что если модификации автомобиля незначительны, то вы можете применить рыночный подход с учетом корректировок стоимости актива.

Давайте предположим, что сначала вы хотите применить доходный подход.

Вы перечисляете все предполагаемые доходы от машины, а также все предполагаемые расходы на поддержание автомобиля в рабочем состоянии, и дисконтируете эти потоки до текущей (приведенной) стоимости — вы получили итоговую справедливую стоимость в размере 75 000 д.е.

Тогда вы хотите также применить затратный подход. Вы должны принять во внимание многие факторы, такие как текущее состояние автомобиля, физический износ, текущая стоимость обслуживания и вы получите стоимость в размере 65 000 д.е.

Какую справедливую стоимость следует выбрать?

Опять же, снова используйте свое суждение.

Затратный подход можно считать более показательным и обоснованным, поскольку он требует меньше суждений и исходные данные менее субъективны, чем при доходном подходе.

При доходном подходе, вы определили приток денежных средств на основе прогнозов, которые также в значительной степени неопределенны (как правило).

С другой стороны, для затратного подхода, вы, вероятно, использовали текущие цены реализации идентичных машин от поставщиков или производителей, поэтому эти исходные данные менее субъективны.

Таким образом, в данном примере можно сделать заключение, что справедливой стоимостью будет сумма в 65 000 д.е., определенная в соответствии с затратным подходом.

Как видите, это очень сложная и субъективная задача, потому что каждая ситуация и актив отличаются, и вы в каждом случае должны применить здравый смысл множество раз.

Источник

Построить, разработать и внедрить модель машинного обучения для прогнозирования стоимости автомобилей с использованием градиентного ускорения.

Дата публикации Mar 9, 2018

Введение

В этой записи блога я расскажу о процессе Data Science для создания и развертывания модели машинного обучения, которая может предсказать цену автомобиля, выполнив следующие шаги:

Постановка цели исследования
Получение данных
Предварительная обработка и очистка данных
Исследование и визуализация данных
Моделирование данных
Развертывание модели

Постановка цели исследования

Целью данной работы является ознакомление с процессом Data Science, как описано выше, путем создания и развертывания модели машинного обучения, которая может предсказать цену автомобиля на основе ее характеристик, с помощью четырех регрессионных моделей и выбора модели с самым высоким R². оценка и наименьшая средняя квадратическая ошибка.

Получение данных

Получение данных — важный шаг после постановки цели исследования, для этого я использовал знаменитую библиотеку python, специализирующуюся на таких задачах, которая “BeautifulSoup” , Процесс для этой задачи довольно прост: сначала мы перебираем рекламные страницы, чтобы собрать рекламные URL-адреса, увеличив параметр номера страницы под названием o в базовом URL, который выглядит так:

как только URL собраны, я установил их в csv файл с именем «ads_urls.csv», который выглядит следующим образом:

Каждая ссылка на эти ссылки выше содержит данные об автомобиле, размещенном в этом объявлении, например: «Модельный год», «Пробег», «Тип топлива», «Цена»…, который выглядит примерно так:

Затем я читаю этот файл, содержащий список URL-адресов для сканирования на страницах объявлений и извлекаю необходимые данные, так что вот краткий снимок кода о том, как это работает.

Наконец я получаю следующую схему данных:

Следующий шаг является самым трудоемким в каждом процессе Data Science, который является предварительной обработкой и очисткой данных.

Предварительная обработка и очистка данных

Очистка данных

Причина предварительной обработки данных состоит в том, чтобы преобразовать наши RAW-данные в полезные, а также уменьшить размер данных, чтобы их было легко анализировать, в этом случае нам необходимо:

price : удалите символ «DH» (валюта дирхама) и пробелы из price затем преобразовать его в целое число.
year_model : удалить ненужную строку из year_model столбец, например: «Année-Modèle:» или «ou plus ancien», затем преобразуйте его в целое число.
mileage : для этого поля ситуация совершенно иная, у нас есть диапазон пробега, например, в каждом наблюдении мы имеем пробег между 160000 — 169999 км, поэтому после удаления символов «KM» и «-» мне пришлось визуализировать этот столбец с способ сохранить только одно значение, а не диапазон, мы можем использовать минимальное или максимальное значение, для меня я решил использовать среднее, чтобы мы оставались в середине этого диапазона.
fuel_type : удалить ненужную строку из fuel_type столбец типа «Тип де карбюрант:».
mark : удалите строку «Marque:» из mark колонка.
fiscal_power : для этого поля мне пришлось обработать 2 случая: удалить ненужную строку, такую как «Puissance fiscale: CV», и обработать значения Missimg, поэтому один из советов по обработке пропущенных значений — заполнить их средним значением всех fiscal_power колонны.

Удалить ненужные столбцы

Для исследования и анализа данных нам не нужны некоторые столбцы, такие как «сектор» и «тип», поэтому в итоге мы удаляем их из фрейма данных.

Исследование и визуализация данных

После этапов извлечения и предварительной обработки данных я должен теперь визуализировать свой набор данных, чтобы получить больше информации о том, что происходит внутри, и о том, как распределяются мои данные.

В следующем разделе я проведу сеанс вопросов и ответов, чтобы ответить на многие вопросы, основанные на гистограммах и графике.

Q: Как распределяется цена по модели года?

A:Как видно из приведенного выше графика, цены на автомобили растут соответственно по годам, и более четко мы можем сказать, что чем больше автомобилей выпущено в последнее время, тем больше увеличивается цена, в то время как с другой стороны самые старые автомобили по-прежнему имеют низкую цену. цена, и это вполне логично, так как всякий раз, когда автомобили становятся старыми со дня выпуска, цена начинает снижаться.

В: Как распределяется цена на фискальную власть?

A:Из вышеприведенного графика мы можем четко заметить, что существует огромная концентрация точек в диапазоне [2800 DH, 800000 DH] и [3 CV, 13 CV], что можно было бы интерпретировать как первую огромную цену доминирования среднего фискального приведите в движение автомобили на рынке с правильной ценой и, во-вторых, чем больше фискальная власть увеличивает цену, тем больше

В: Как цена распределяется по годовой модели по типу топлива?

A:Несмотря на слабость, кажется, что между year_model а также price Давайте посмотрим, какова фактическая корреляция между ценой и другими точками данных. Мы подтвердим это, посмотрев на матрицу корреляции Heatmap.

Как мы видим, между price а также year_model характеристики с 0,47 в качестве показателя корреляции, который подтверждает тесную связь между price а также year_model колонны.

Моделирование данных

Теперь мы подошли к основной задаче всего этого процесса — моделированию данных. Для этой цели я буду использовать 4 модели машинного обучения, предназначенные для задач регрессии, а в конце я сделаю таблицу сравнительного анализа для сравнения каждой модели. r2_score и выберите лучший. Используются следующие модели: K регрессия ближайших соседей, множественная линейная регрессия, регрессия дерева решений и регрессия повышения градиента.

Преобразование данных

Я намеренно оставляю эту часть до моделирования данных вместо того, чтобы делать это с предварительной обработкой данных для некоторых целей визуализации.

На данный момент у меня все еще есть 2 категорических особенности, которые являются fuel_type а также mark Цель этого раздела — предварительно обработать эти функции, чтобы сделать их числовыми, чтобы они вписывались в нашу модель. В литературе есть два известных способа преобразования категориальных переменных, первыйкодирование этикеткии второйодна горячая кодировка, для этого варианта использования мы будем использовать одну горячую позицию, и причина, по которой я выбираю этот вид маркировки данных, заключается в том, что мне не понадобится какая-либо нормализация данных позже, и это также дает преимущество, заключающееся в том, что не взвешивает значение неправильно, но делает есть обратная сторона добавления большего количества столбцов к набору данных.

Как показано на рисунке выше, после преобразования категориальных признаков в числовые с использованием одного горячего кодирования мы получили широкий кадр данных.

Разделение данных

Обычно мы делим наши данные на три части: набор обучения, валидации и тестирования, но для простоты мы будем использовать только обучение и тестирование с размером теста 20%, а остальное — для обучения.

Градиентная регрессия

Boosting — это еще один метод ансамбля для создания набора мощных предикторов, а Gradient Boosting — это метод для создания регрессионных моделей, состоящих из наборов регрессоров.

Ансамбль — это совокупность предикторов, чьи предсказания обычно объединяются с помощью некоторого взвешенного среднего или голоса, чтобы обеспечить общее предсказание, которое основывается на самой коллекции. Таким образом, повышение является ансамблевой техникой, в которой учащиеся обучаются последовательно, когда учащиеся раннего возраста подбирают простые модели для данных, а затем анализируют данные на наличие ошибок. Эти ошибки выявляют проблемы или конкретные экземпляры данных, которые трудно или трудно приспособить, как следствие. более поздние модели сосредотачиваются, прежде всего, на тех примерах, которые пытаются понять их правильно.

В конце все модели вносят свой вклад с весами, и набор объединяется в некоторые общие предикторы, поэтому повышение — это метод преобразования последовательности слабых учеников в очень сложный предиктор, способ увеличения сложности конкретной начальной модели. ученики, как правило, очень просты, и тогда взвешенная комбинация может становиться все более и более сложной по мере добавления учеников.

Математика, стоящая за повышением градиента

Этот алгоритм является примером повышения градиента, он называется повышением градиента, потому что он связан с процедурой градиентного спуска.

Сначала мы делаем набор прогнозов ŷ(i) для каждой точки данных.
Мы можем рассчитать ошибку в наших прогнозах, давайте назовем это J(y, ŷ) , а J просто связывает точность ŷ в моделировании y.
Для среднеквадратичной ошибки MSE: J(y, ŷ) = Σ ( y(i) —ŷ(i) )²,
Итак, теперь мы можем попытаться подумать о корректировке нашего прогноза ŷ чтобы попытаться уменьшить ошибку выше: ŷ(i)= ŷ(i) + α *∇J(y, ŷ) , с : ∇J(y, ŷ) = y(i)- ŷ(i)
Каждый учащийся оценивает градиент функции потерь.
Градиентный спуск: предпринять последовательность шагов, чтобы уменьшить J ,
Сумма предикторов, взвешенная по размеру шага альфа.

Градиентный регрессор — снимок кода

Интерпретация остаточных VS прогнозируемых значений

После построения модели GBR в большинстве случаев рекомендуется составить график распределения ошибок, чтобы проверить следующие предположения:

Нормально распределенный
Homoscedastic (та же самая разница в каждом X)
независимый

что уже проверено в нашем случае, как вы можете проверить наблокнотдля более подробной информации, однако, мы должны наблюдать остаточный график, чтобы убедиться, что он не следует нелинейному распределению или распределению гетероскедастичности

Как видно из приведенного выше графика, остатки примерно образуют «горизонтальную полосу» вокруг линии 0, это говорит о том, что дисперсии слагаемых ошибок равны, более того, ни один остаток не «выделяется» из основной случайной структуры остатков которые предполагают, что нет никаких выбросов.

Сравнительный анализ моделей

Поэтому, после того как многие регрессионные модели соответствуют нашему набору данных, пришло время составить таблицу сравнительного анализа, в которой будут обобщены все полученные результаты.

Похоже, что модель Gradient Boosting выиграла битву, как и ожидалось, с самым низким значением RMSE и самым высоким значением R².

Развертывание модели с Heroku

Создание веб-приложения Flask

Flask — это «микро» фреймворк для Python. Это называется микро-фреймворк, потому что они хотят, чтобы ядро было простым, но расширяемым. На первый взгляд, запутав, довольно легко настроить веб-сайт на Flask с использованием шаблонов Jinja2.

Приложение фляги состоит из 2 основных компонентов: приложение python ( app.py ) и шаблоны HTML, для app.py вот как это выглядит:

Так как только app.py построен, мы можем запустить его из терминала, если все пойдет хорошо, мы получим index.html страница, работающая по маршруту ‘/ ’как: http://localhost:8080/ Затем мы можем заполнить данную форму правильными значениями и получить результат в виде всплывающего окна с предупреждением.

2. Разверните приложение в Heroku

Для этой части мне понадобитсяHerokuаккаунт (бесплатный) и HerokuCLI, я также могу использовать GitHub для этой задачи, но давайте сделаем все проще.

Установите Procfile: Procfile — это механизм для объявления, какие команды запускаются динамо вашего приложения на платформе Heroku. Создайте файл с именем «Procfile» и поместите в него следующее:

Создайте файл требований python, выполнив следующую команду в терминале в корне приложения Flask:

если вы работаете в виртуальной среде Python, это будет эффективно:

Создайте новое приложение на веб-сайте Heroku, войдя в свою учетную запись.

После того, как приложение будет хорошо создано, мы будем перенаправлены на страницу с инструкциями по успешному развертыванию. После успешного подключения к HerokuCLI мне нужно изменить каталог на наше приложение фляги и выполнить следующую команду:

Приложение должно быть теперь на my-app-name.herokuapp.com! Проверьте рабочую версию приложенияВот,

Вывод

В этом сообщении в блоге я попытался осветить процесс науки о данных, построив модель, которая может прогнозировать цену автомобилей на основе ее функций, начиная от сбора данных до моделирования данных и сравнения встроенных моделей и заканчивая развертыванием модели как веб-приложение.

Полезные ссылки

PaacMaan / авто-цена-предсказатель

Предсказатель цены автомобиля — Этот проект шаг за шагом показывает, как построить модель, которая может предсказать цену автомобиля на основе…

github.com

Если вы обнаружили, что это сообщение в блоге было полезным для вас или кого-то из вашей сети, не стесняйтесь отправлять пожертвования на мою учетную запись PayPal.

Источник