Skip to content

Commit

Permalink
Merge branch 'spanish-report'
Browse files Browse the repository at this point in the history
  • Loading branch information
daben committed Apr 14, 2018
2 parents 3655bbf + 81aac13 commit 3441a62
Show file tree
Hide file tree
Showing 3 changed files with 157 additions and 0 deletions.
Binary file added Informe.pdf
Binary file not shown.
154 changes: 154 additions & 0 deletions README_es.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,154 @@

# Bali Airbnb April 2018

## Una mirada al listado de propiedades de Airbnb en Bali, Indonesia

![A view of Bali][ref:image]
<span style="font-size: 8pt; float:right;">
CC BY SA-3.0 &mdash; *[A view of Bali][ref:image_source]*
</span>

### Autor

David Moriano <[[email protected]](mailto:[email protected])>

### Contexto

Airbnb afirma ser parte de la "economía colaborativa" y de romper la industria hotelera. Analizando los datos en una ciudad o región podremos descubrir por nosotros mismos el impacto real de "compartir el hogar".

### Contenido

Este conjunto de datos contiene más de 12000 listados de propiedades Airbnb en Bali, Indonesia, recogidos en Abril del 2018. No pretende ser una colección completa de todos las propiedades disponibles en Bali pero con suerte puede ser un conjunto representativo.

Los datos han sido recogidos de Airbnb.com mediante un scraper creado con [Scrapy][ref:scrapy]. El scraper itera sobre los sectores de Bali que proporciona Airbnb y sobre el rango de precios (en incrementos de 10 USD). Esta metodología no garantiza la recopilación de todas las propiedades listadas en una ciudad o territorio, pero permite profundizar más allá de las apenas 300 entradas que Airbnb ofrece a través de su web.

El scraper debería ser lo bastante genérico como para funcionar en otras ciudades. No obstante, no se dan garantías al respecto.

Los datos incluyen los siguientes campos:

| Columna | Descripción | Tipo |
| ------ | ----------- | ---- |
| _id | Listing identifier in Airbnb | Numeric |
| name | Name of the listing | String |
| user_id | User identifier of the host | Numeric |
| user_name | First name of the host | String |
| city | City name | String |
| neighborhood | Neighborhood | String |
| latitude | Latitude of the neighborhood | Numeric |
| longitude | Longitude of the neighborhood | Numeric |
| section_offset | Page number on which it was listed | Numeric |
| bathrooms | Number of bathrooms | Numeric |
| bedrooms | Number of bedrooms | Numeric |
| beds | Number of beds | Numeric |
| business_travel_ready | Can accommodate business travelers | Boolean |
| host_languages | Host languages | Array |
| new_listing | Is it a new listing? | Boolean |
| person_capacity | Guests capacity | Numeric |
| property_type | Type of property | Numeric |
| refundable | Is it refundable | Boolean |
| reviews_count | Number of review | Numeric |
| room_type | Room type | Numeric |
| scrim_color | [Scrim][ref:scrim] color | String |
| star_rating | Star rating given by the guests | Numeric |
| superhost | Is the host a superhost | Boolean |
| tier_id | Tier identifier | Numeric |
| verified | Is it a verified host | Boolean |
| price_rate | Price rate in USD | Numeric |
| price_rate_type | Price rate type | Numeric |
| weekly_price_factor | Weekly stay discount factor | Numeric |
| monthly_price_factor | Monthly stay discount factor | Numeric |

### Inspiración

Claramente, este conjunto de datos se puede utilizar para encontrar el lugar ideal para las próximas vacaciones en Bali (y potencialmente en otro destino). O también se puede utilizar para determinar el precio ideal de tu propiedad si la quieres listar en Airbnb. Estas cuestiones prácticas son sin duda de mucho interés, pero también se puede mirar a este conjunto de datos desde un contexto diferente.

El interés en los datos de Airbnb surge de la investigación realizada por Murray Cox ([InsideAirbnb.com][ref:insideairbnb]) sobre el impacto de Airbnb en la [gentrificación][ref:gentrification] de New York. Murray Cox intenta responder a algunas preguntas relevantes dado el tamaño de las activades de Airbnb: ¿Cómo se está usando Airbnb? ¿Cómo está afectando a los diferentes barrios de New York? Su investigación ha sido expandida recientemente por el grupo de investigación Urban Planning and Governance de la universidad McGill en Canada en un [informe][ref:upgo-report] que responde a estas preguntas:

1. Dónde se localiza en New York la actividad de Airbnb, y cómo está cambiando.
2. Quién hace dinero con Airbnb en New York.
3. Cuantas viviendas se han perdido en New York en Airbnb.
4. Es Airbnb responsable de gentrificación en New York.

La revista [CityLab][ref:citylab] ha publicado un interesante [artículo][ref:citylab-article] sobre esta investigación.

Está claro que nos podemos hacer las mismas preguntas sobre otras ciudades.

Bali es el centro cultural de Indonesia y uno de los lugares más turísticos del mundo; el turismo supone el 80% de la economía de esta isla. La actividad de Airbnb en Bali es muy significativa, es natural preguntarse cual es su impacto.

### Licencia

Los datos se publican con licencia:

[Creative Commons Attribution-NonCommercial 4.0 International License][cc:by-nc].

Esto significa que los datos se pueden:

- Compartir - copiar y redistribuir en cualquier medio o formato
- Adaptar - reorganizar, transformar y construir sobre los datos

Con las siguientes condiciones:

- Atribución - Se debe dar crédito, proporcionar un enlace a la licencia, e indicar si se han hecho cambios, de cualquier modo que sea razonable, pero no de forma que se sugiera que el licenciante te respalda a ti o al uso que hagas de los datos.
- No-comercial - No se pueden usar los datos para propósitos comerciales.

Se pueden consultar los detalles completos de la [licencia][cc:by-nc-legalcode] en este enlace.

La razón de esta licencia es que este conjunto de datos se ha construido en un contexto académico con propósito educativo o de investigación. La idea es mantener esa intención.

### Agradecimientos

Gracias a Airbnb por permitir el scraping en su website. Y gracias a los desarrolladores de [Scrapy][ref:scrapy] por esta magnifica herramienta.

### Código

El código del scraper está disponible en el repositorio [github.com/daben/m2851](https://github.com/daben/m2851-prac1) en el directorio [airbnb_scraper](https://github.com/daben/m2851-prac1/airbnb_scraper).

El código se publica bajo [licencia MIT][ref:code-license].

Para ejecutar el scraper se ejecuta:
```bash
$ scrapy crawl airbnb -a query="Bali, Indonesia" -o bali_listings.csv
```

### Files

| File | Description |
|:-----|:------------|
| `.gitignore` | Specifies intentionally untracked files to ignore in the repository |
| `LICENSE` | Data license |
| `Pipfile` | See https://github.com/pypa/pipenv |
| `Pipfile.lock` | ditto |
| `README.md` | This document |
| **`airbnb_scraper/`** | Scraper project folder |
| `../LICENSE` | Code License |
| `../scrapy.cfg` | Scrapy configuration file |
| **`../airbnb_scraper/`** | Scraper code |
| `../../__init__.py` | Module initialization |
| `../../items.py` | AirbnbListing item |
| `../../middlewares.py` | Middleware (not used) |
| `../../pipelines.py` | Pipelines: remove duplicates |
| `../../settings.py` | Scraper settings |
| **`../../spiders/`** | Spiders folder |
| `../../../__init__.py` | Spiders module initialization |
| `../../../airbnb.py` | Airbnb spider |
| `assets/banner.jpg` | Banner image |

### Dataset

- [listings_bali_201804.csv][ref:dataset] (~3MiB)

[//]: # (References)

[ref:image]: ./assets/banner.jpg
[ref:image_source]: https://commons.wikimedia.org/wiki/Bali#/media/File:Ubud_banner.jpg
[ref:scrapy]: https://scrapy.org/
[ref:scrim]: https://en.wikipedia.org/wiki/Scrim_(lighting)
[ref:insideairbnb]: http://insideairbnb.com/index.html
[ref:gentrification]: https://en.wikipedia.org/wiki/Gentrification
[ref:citylab]: https://www.citylab.com/
[ref:citylab-article]: https://www.citylab.com/equity/2018/03/what-airbnb-did-to-new-york-city/552749/
[ref:upgo-report]: https://mcgill.ca/newsroom/files/newsroom/channels/attach/airbnb-report.pdf
[cc:by-nc]: https://creativecommons.org/licenses/by-nc/4.0/
[cc:by-nc-legalcode]: https://creativecommons.org/licenses/by-nc/4.0/legalcode
[ref:code-license]: https://github.com/daben/m2851-prac1/tree/master/airbnb_scraper/LICENSE
[ref:dataset]: https://github.com/daben/m2851-prac1/tree/master/data/listings_bali_201804.csv
3 changes: 3 additions & 0 deletions build_report.sh
Original file line number Diff line number Diff line change
@@ -0,0 +1,3 @@
pandoc -t latex \
-V linkcolor=blue -V urlcolor=blue \
README_es.md -o Informe.pdf

0 comments on commit 3441a62

Please sign in to comment.