Projeto 2
Como eu já disse antes, eu participo do PIBIC. Como aprendizagem de máuqina é um assunto vasto e desafiador (para meros mortais como eu) decidi criar um projeto introdutório na área. Ele é um projeto ainda em andamento, onde eu implemento técnicas de aprendizagem de máquina a partir do zero, sem a ajuda de bibliotecas como TensorFlow, Scikit-learn, PyTorch, entre outras. Além disso, o projeto serve como um repositório que tem o objetivo de oferecer uma introdução ao assunto.
A pasta PedestrianDetection contém apenas uma parte do có'digo original que eu utilizei no meu trabalho de Iniciação Científica. O código é apenas um pequeno tratamento de dados realizado no DAIMLER dataset de Gravila e Munders, você pode acessar ele aqui.
A figura abaixo mostra uma imagem aleatória de um pedestre do DAIMLER dataset. As imagens do dataset tem formato 36x18 e variam em tonalidades de cinza, ou seja, são imagens PGM.
O código disponível no repositório apenas faz um pequeno tratamento nas imagens. Ainda falta alguns detalhes, porém a planificação das matrizes (imagens) e o embaralhamento dos dados já foi realizado. A tabela 2 mostra um exemplo de como a rotulação é feita.
| Imagem | Rótulo |
|---|---|
| pedestre | 1 |
| pedestre | 1 |
| não pedestre | 0 |
| pedestre | 1 |
| não pedestre | 0 |
| ... | ... |
Uma iamgem recebe rótulo 1 caso seja de pedreste, caso contrário, recebe rótulo 0. O Dataset é bem simples, com 39000 imagens no total, todas elas tendo baixa resolução. Não é um ILSVRC2012 da vida, mas já serve como um conjunto de dados básico para aprender aprendizagem de máquina.