Data Science – Solved

$ 24.99
Category:

Description

Data Science HW2

【資料集說明】
目標:透過 19 個 attributes 去分析各個 data 是否為同一群。

在此dataset中,每筆id(rows)代表一張圖片,而一張圖片通常可以用多個屬性(columns)集合來表示,以下為各屬性所代表的意思,請利用這些屬性將資料做分群(也就是同一群內的圖片具有較相似的屬性)。
Feature1-2: 該圖片中物件的中心點座標值
Feature3: 將圖片預先分成九個區塊,故皆為9
Feature4: line extraction的結果中低對比且長度小於等於5的區域則為1,
並且正規化

Feature5: line extraction的結果中低對比且長度大於5的區域則為1,
並且正規化

[註:line extractionalgorithm是在做圖像分析時會用到的特徵萃取演算法]

Feature6: 該區域在水平鄰近像素對比度的平均值
Feature7: 該區域在水平鄰近像素對比度的標準差
Feature8: 該區域在垂直鄰近像素對比度的平均值
Feature9: 該區域在垂直鄰近像素對比度的標準差
Feature10: 每個區域的密度平均值或所謂的灰階值,公式為(R+B+G)/3

Feature11-13: RGB在該區域各自的平均值

Feature14-16: RGB在該區域各自的excessvalue,公式分別為(2R-G-B)、

(2B-G-R)、(2G-R-B)

Feature17-19:分別為明度、飽和度、色相的平均值

data.csv

id為每項data的編號,每項data總共有19個attributes,全部有2100筆資料。

test.csv

在此文件內,顯示的是我們需要比較是否為相同cluster的 data編號,例如: index 0要比較的資料為 id 1303 以及 id 1234。

submit.csv

需要將預測結果 (0:不為同一群/1:同一群)寫進 submit.csv 內,也就是在 index 0 的ans需要把 id 1303 & id 1234 是否為同一群的結果寫入,同理 index 1 的 ans 需要寫入 id 1710 & id 878 是否為同一群的結果,以此類推,總共要預測400筆資料。

Reviews

There are no reviews yet.

Be the first to review “Data Science – Solved”

Your email address will not be published. Required fields are marked *