アメブロを支えるMySQL:サイバーエージェントのMySQLチューニング術
アメーバブログ(アメブロ)はサイバーエージェントが運営する無料のブログサービスである。同社のデータベースチームは急激に増加し続けるアクセスに対応し、パフォーマンスを維持するために、データベースの改善を続けてきたという。その経緯と現状が、MySQL ユーザコンファレンス 2008の場で紹介された。
アメブロにおけるデータベース改善の歴史
サービスを開始した2006年9月時点では、Active-Standby構成のOracle 10g 2台のみで、MySQLは使用していなかった。これで4億PV(ページビュー)を支えていたという。
その後、アクセスの増加に伴ってハードウェアを拡充し、現在はOracle 10g RAC 4台(Active3台-Standby1台)構成になり、MySQLはマスターに1台、スレイブに41台を導入しているとのこと。
このシステムは2006年10月からMySQLを導入し、記事、コメント、トラックバックの参照画面を順次、MySQLに移行していった。データの移行に際しては、当初は移行用バッチサーバによる移行を計画したが、時間がかかりすぎるためうまくいかなかったという。
そこでOracleのUTL_FILEコマンドでデータを出力し、それをMySQLのLOAD DATA INFILEでインポートした。この方法でレコード数約2億400万件を約4時間程度で移行できたとのことだ。
同時に発行するSQLの改善も行った。これはデータとアクセス数の増加に対して、サーバ増設だけではスケールアウトできなくなったからである。特にrange検索の負荷が大きかったため、ここを中心にSQL改善を行っている。
基本的な方針はINDEXを見直してexplainの結果が「Using index」になるようにし、I/Oの負荷を軽減させること。そのほか、検索結果や検索範囲の制限も行っている。このSQL改修によってSlow Queryは0になり、Disk I/Oも大幅に減少したが、一方でSQLの発行回数はおよそ2倍に増加し、MyISAMキーバッファミス率も0.09%から0.39%まで増大してしまったという。
しかし、肝心のLoad Averageは大幅に減少しており、Disk I/O減少の影響が全体のパフォーマンス改善に大きく寄与したことが確認できたとのことだ。
同社では上記以外にも、実際のデータベース負荷を利用したGNU/LinuxとOpenSolaris、Ext3やXFS、ZFSでのパフォーマンス比較などを行い、今後の改善の方向性を模索しているという。また、将来予定している自作サーバ全面導入に向け、SSDや安価なRAIDカードでのMySQL導入テストも実施しており、セッションおよび同社ブースにおいてその結果がレポートされた。
- 新着記事
- 特集
- ブログ
- 企画特集
-
複雑なセキュリティ運用と決別を!
-
働き方改革のカギはズバリこれ!
-
事例で知るAWS徹底活用!
-
悩ましい!生産性と管理強化の天秤
-
「カジュアルなIoT」を実践!
-
漫画:輸出管理の困ったに
-
AWSセミナー講演レポート
-
AWSセミナー講演レポート
-
NWに悩まない次世代クラウド基盤!
-
加速する基幹システムのオープン化
-
ITガバナンス協会副理事に聞く!
-
いまどきのクラウド用語12選
-
デジ変した世界の勝ちパターン探る
-
AWSセミナー講演レポート
-
急げ!新たなネットインフラの革新
-
SBI証券の挑戦!!
-
最近、Office 365が重い…!?
-
どのクラウドかは重要ではない
-
DX時代に競争力の源泉となるHCI
-
AWSセミナー講演レポート
-
クラウドがもたらすITの価値
-
衝撃!サイバー攻撃の9割はメール
-
「ためられない」と分析もできない
-
結局ここで手を抜いたら終わり…!
-
必須の時代!AIチャットボットの力
-
特集:ブロック至上主義からの脱却
-
IoT時代の新たなモノづくり
-
AWSセミナー講演レポート
-
まさにインフラ担当者の希望の星!
-
ビジネス視点で評価せよ!
-
コネクテッド・エンタープライズへ
-
「ゼロ情シス」企業こそ攻めのITへ
-
兼任情シスでも、手は緩められない
-
対談:大谷イビサ氏×ZDNet編集長
-
転換期を戦える組織やチームを作れ
-
真の生産性向上を成す働き方とは
-
vFORUMレポ!次世代の構築・運用へ
-
熱視線!「次世代メガクラウド」
-
Windows 10 移行の課題に切り込む
-
AWSセミナー講演レポート
-
5G時代のネットワーク運用最前線
-
AWSセミナー講演レポート
-
CIOは部分最適ではいけない
-
コンタクトセンターが変わる!
-
特集:AWS活用はここまできた
-
すぐに使えるデータは3割以下
-
IoTは次のフェーズへ
-
機械学習は敷居が高い?
